高級語言作用域是如何實現的-tft每日頭條

高級語言作用域是如何實現的

生活更新时间:2026-07-31 16:55:29

MURAL：跨語言的多模式、多任務檢索

對于許多概念，沒有從一種語言到另一種語言的直接一對一翻譯，即使有，這種翻譯也經常帶有不同的聯想和内涵，對于非母語人士來說很容易丢失。然而，在這種情況下，當以視覺示例為基礎時，含義可能會更加明顯。以“婚禮”這個詞為例。在英語中，人們經常将穿着白色連衣裙的新娘和穿着燕尾服的新郎聯系起來，但當翻譯成印地語 (शादी) 時，更合适的聯想可能是穿着鮮豔色彩的新娘和穿着雪瓦尼的新郎。每個人對這個詞的聯想可能會有很大差異，但如果向他們展示預期概念的圖像，其含義就會變得更加清晰。

高級語言作用域是如何實現的（跨語言的多模式）1

随着神經機器翻譯和圖像識别的當前進步，可以通過呈現與支持圖像配對的文本來減少翻譯中的這種歧義。先前的研究在學習高資源語言（如英語）的圖像-文本聯合表示方面取得了很大進展。這些表示模型努力将圖像和文本編碼為共享嵌入空間中的向量，以便圖像和描述它的文本在該空間中彼此接近。例如，ALIGN和CLIP已經表明，當提供充足的訓練數據時，使用對比學習損失在圖像-文本對上訓練雙編碼器模型（即，一個用兩個單獨的編碼器訓練的模型）效果非常好。

不幸的是，對于大多數語言，這種圖像-文本對數據并不以相同的規模存在。事實上，超過 90% 的這類網絡數據屬于前 10 名資源豐富的語言，如英語和中文，而資源匮乏語言的數據要少得多。為了克服這個問題，人們可以嘗試為資源不足的語言手動收集圖像-文本對數據，這将因工作規模而變得非常困難，或者可以尋求利用預先存在的數據集（例如，翻譯對）可以為多種語言提供必要的學習表示。

在“ MURAL：Multimodal, Multitask Retrieval Across Languages ”中，在EMNLP 2021 的發現中展示，我們描述了一種圖像-文本匹配的表示模型，該模型使用應用于圖像-文本對的多任務學習以及涵蓋 100 多種語言的翻譯對。這項技術可以讓用戶使用圖像來表達可能無法直接翻譯成目标語言的單詞。例如，“ valiha ”這個詞，指的是馬達加斯加人演奏的一種電子管古筝人，它沒有直接翻譯成大多數語言，但可以很容易地用圖像來描述。從經驗上講，MURAL 顯示出對最先進模型、其他基準和全面競争基準的持續改進。此外，MURAL 在測試它的大多數資源不足的語言中表現非常好。此外，我們發現了通過 MURAL 表示學習的有趣的語言相關性。

MURAL 架構

MURAL 架構基于ALIGN的結構，但以多任務方式使用。ALIGN 使用雙編碼器架構來繪制圖像和相關文本描述的表示，而 MURAL 使用雙編碼器結構實現相同目的，同時還通過合并翻譯對将其擴展到跨語言。圖像-文本對的數據集與用于 ALIGN 的數據集相同，翻譯對是用于LaBSE 的數據集。

MURAL 解決了兩個對比學習任務：1）圖像-文本匹配和 2）文本-文本（雙文本）匹配，這兩個任務共享文本編碼器模塊。該模型從圖像-文本數據中學習圖像和文本之間的關聯，并從翻譯對中學習數百種不同語言的表示。這個想法是共享編碼器将從資源豐富的語言中學習到的圖像-文本關聯轉移到資源不足的語言中。我們發現最好的模型采用了EfficientNet-B7圖像編碼器和BERT 大文本編碼器，兩者都是從頭開始訓練的。學習到的表示可用于下遊的視覺和視覺語言任務。

高級語言作用域是如何實現的（跨語言的多模式）2

多語言圖像到文本和文本到圖像檢索

為了展示 MURAL 的能力，我們選擇了跨模式檢索任務（即檢索給定文本的相關圖像，反之亦然）并報告各種學術圖像-文本的分數數據集涵蓋資源豐富的語言，例如MS-COCO（及其日語變體STAIR）、Flickr30K（英文）和Multi30K（擴展到德語、法語、捷克語）、XTD（僅測試集，包含七種資源豐富的語言）：意大利語、西班牙語、俄語、中文、波蘭語、土耳其語和韓語）。除了資源豐富的語言，我們還在最近發布的維基百科圖像文本（WIT）上評估了 MURAL) 數據集，涵蓋 108 種語言，包括資源豐富的（英語、法語、中文等）和資源不足的（斯瓦希裡語、印地語等）語言。

在對資源充足和資源不足的語言進行評估的零樣本和微調設置中，MURAL 始終優于先前的最先進模型，包括M3P、UC2和ALIGN。與最先進的模型 ALIGN 相比，我們看到資源不足的語言有顯着的性能提升。

高級語言作用域是如何實現的（跨語言的多模式）3

檢索分析

我們還分析了WIT 數據集上的零樣本檢索示例，比較了英語 (en) 和印地語 (hi) 的 ALIGN 和 MURAL。對于像印地語這樣資源不足的語言，與 ALIGN 相比，MURAL 顯示出改進的檢索性能，這反映了對文本語義的更好掌握。

高級語言作用域是如何實現的（跨語言的多模式）4

即使對于資源豐富的語言（如法語）中的圖像→文本檢索，MURAL 也顯示出對某些單詞的更好理解。例如，與不檢索任何描述日晷的文本的 ALIGN 相比，MURAL 為查詢“ cadran solaire ”（法語中的“sundial”）返回更好的結果（如下）。

高級語言作用域是如何實現的（跨語言的多模式）5

嵌入可視化

此前，研究人員已經表明，将模型嵌入可視化可以揭示語言之間有趣的聯系——例如，神經機器翻譯(NMT) 模型學習的表示已被證明可以根據它們對語言家族的成員資格形成集群。我們對屬于日耳曼語、羅曼語、斯拉夫語、烏拉爾語、芬蘭語、凱爾特語和芬蘭-烏戈爾語系（在歐洲和西亞廣泛使用）的語言子集執行類似的可視化。我們比較附壁文本的嵌入LaBSE的，這是一個純文本的編碼器。

LabSE 的嵌入圖顯示了受語言家族影響的不同語言集群。例如，羅曼語言（下圖紫色）與斯拉夫語言（下圖棕色）屬于不同的區域。這一發現與之前研究 NMT 系統學習的中間表示的工作一緻。

高級語言作用域是如何實現的（跨語言的多模式）6

與 LaBSE 的可視化相反，通過多模态目标學習的 MURAL 嵌入顯示了一些符合區域語言學（地理區域中的語言或方言共享元素）和接觸語言學（語言或方言相互作用的地方）的集群并相互影響）。值得注意的是，在 MURAL 嵌入空間中，羅馬尼亞語 (ro) 更接近于保加利亞語 (bg) 和馬其頓語 (mk) 等斯拉夫語，這與巴爾幹語 ( Balkan sprachbund) 一緻，而不是在 LaBSE 中。另一種可能的語言接觸使芬蘭語、愛沙尼亞語 (et) 和芬蘭語 (fi) 更接近斯拉夫語族群。MURAL 以圖像和翻譯為中心的事實似乎增加了在深度表示中學習的語言相關性的額外觀點，超出了在純文本設置中觀察到的語言家族聚類。

高級語言作用域是如何實現的（跨語言的多模式）7

最後的評論

我們的研究結果表明，使用翻譯對聯合訓練有助于克服許多資源不足語言的圖像-文本對的稀缺性，并提高跨模态性能。此外，在使用多模态模型學習的文本表示中觀察區域語言學和接觸語言學的提示很有趣。這需要更多地探索由多模态模型（例如 MURAL）隐式學習的不同連接。最後，我們希望這項工作能促進多模态、多語言空間的進一步研究，在這些空間中，模型學習語言之間的表示和聯系（通過圖像和文本表達），而不僅僅是資源豐富的語言。

高級語言作用域是如何實現的（跨語言的多模式）8

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活臘八節諸事粥全
過了臘八就是年一年一歲一團圓今天是臘八節，俗稱“臘八”即農曆十二月初八臘八節是中國的傳統節日上古時代冬季祭祖的日子叫“大臘”臘月初八漸漸定為“臘日”它祈求着豐收、寓意着吉祥臘八到，粥飄香臘八到，粥飄香在“臘八”當日喝一碗香噴噴的臘八粥是這個... 2023-02-18
生活沒有年檢标志怎麼處罰
沒有年檢标志怎麼處罰?不按期年檢的車輛，除了車輛行駛安全得不到保障外，根據《道路交通安全法》，車輛逾期未年檢，将對駕駛員處以200元罰款，記3分處罰，我來為大家科普一下關于沒有年檢标志怎麼處罰?下面希望有你要的答案，我們一起來看看吧!沒有年... 2022-06-04
生活獵豹廠家在哪裡
“‘感謝獵豹’讓犯規無處逃脫。”7日晚，北京冬奧會短道速滑男子1000米決賽，參賽選手之間多次出現碰撞和意外。最終裁判員回看視頻系統，認定中國選手任子威奪冠、李文龍摘得銀牌。賽後，不少網友直呼：“謝謝獵豹”。“獵豹”到底是什麼？短道速滑賽場... 2022-11-27
生活一夜暴富動漫國漫
根據官方公開的新消息，韓國漫畫《大貴族》改編TV動畫《NOBLESSE：AWAKENING》先導PV已經公布，由ProductionI.G制作，新垣樽助、平川大輔等聲優配音，預計将于2020年10月放送。《NOBLESSE：AWAKENIN... 2022-11-10
生活眉毛二次補色的忌諱
這裡是紋繡半永久培訓中心，每天我們不定時更新紋繡知識。不管你在哪裡，隻要打開手機或者電腦随時随地都可以輕松理解半永久紋繡知識。眉毛補色，宜遲不宜早、宜淡不宜濃。最近總是有MM們做過半永久眉毛後四、五天左右發給我一張照片問眉毛顔色怎麼掉了一塊... 2023-02-15
生活少女感爆棚美女
, 2023-04-01
生活重慶适合一年四季種植水果蔬菜
重慶日報客戶端消息，“‘水上漂’蔬菜育苗技術，看着很神秘，作用也很神奇，最多可讓葉菜提前10天時間上市！”近日，重慶市蔬菜産業技術體系專家陶偉林到榮昌區仁義鎮開展速生葉菜技術培訓，講解蔬菜漂浮育苗技術。據了解，近期我市通過保障菜種供應、技術... 2022-11-30
生活自建房不允許經營
長沙晚報掌上長沙6月3日訊（全媒體記者周輝霞）哪些居民自建房可以開展經營活動，哪些情況不能作為經營場所？經營性自建房裡可以做哪些生意，禁止從事哪些行業？6月1日，市政府辦公廳印發《關于加強居民自建房用作經營場所管理的暫行規定》（以下簡稱《規... 2023-04-03
生活怎麼樣才可以在電視上玩吃雞
“大吉大利今晚吃雞”時下熱門的競技遊戲“吃雞”相信不少小夥伴都玩過但是小夥伴們都不知道一個“秘密"那就是……“吃雞”裡面的電視真的能放畫面不信你瞧☟☟☟裡面的鏡頭不就是咱們的觀山湖嗎？還有月底将要開幕的第四屆“愛心觀山湖”旅遊文化節（沒錯，... 2023-03-10
生活
?澎湃新聞記者明鵲每次想起⺟親禹秀英、以及⽀離破碎的家，21歲的陳昌雨心口像刺入了⼀把⼑，隐隐作痛，接下來我們就來聊聊關于?以下内容大家不妨參考一二希望能幫到您!澎湃新聞記者明鵲每次想起⺟親禹秀英、以及⽀離破碎的家，21歲的陳昌雨心口像刺入... 2022-12-22
生活核舟記中的雕欄相望焉中的焉是什麼意思
核舟記中的雕欄相望焉中的焉是什麼意思?焉是語氣助詞放在句末沒有具體意義“雕着花紋的欄杆互相對稱”，現在小編就來說說關于核舟記中的雕欄相望焉中的焉是什麼意思?下面内容希望能幫助到你，我們來一起看看吧!核舟記中的雕欄相望焉中的焉是什麼意思焉是語... 2022-06-01
生活周公解夢左眼皮跳是什麼預兆
周公解夢左眼皮跳是什麼預兆?創業的人夢見左眼皮跳，代表服務大，房地産、農作物得财利，不必急慢慢經營，下面我們就來聊聊關于周公解夢左眼皮跳是什麼預兆?接下來我們就一起去了解一下吧!周公解夢左眼皮跳是什麼預兆創業的人夢見左眼皮跳，代表服務大，房... 2022-06-29
生活創意鉛筆畫跷跷闆
教學目的1.學習跷跷闆的百科知識；2.感受柳丁帶來的在畫面中的不同效果；3.學習美麗的顔色搭配。教學準備白色卡紙、黑色砂紙、重彩油畫棒、勾線筆、馬克筆教學引導同學們有沒有玩過跷跷闆啊，跷跷闆呢是一種二人以上參與的兒童玩具。坐在跷跷闆上，一人... 2023-02-08
生活拳皇15各隊伍名單最新
格鬥遊戲《拳皇15》很快即将正式發售，今天（2月15日），遊戲開發商SNK公開了本作的最終宣傳片，一起來看看吧。《拳皇15》最終宣傳片：優酷視頻雲《拳皇15》使用虛幻4引擎開發制作，遊戲初始版本包含39名角色，今年年内将通過DLC追加另外1... 2023-03-17
生活小米手機怎麼使用米聊
IT之家1月19日消息今天小米旗下米聊宣布将于2021年2月19日12點00分停止米聊的服務，IT之家獲悉，公告顯示，請用戶在停服前自行導出聊天記錄及個人資料等信息（安卓v8.8.70及以上版本支持批量導出），停服後将無法導出用戶在米聊内的... 2023-03-30
生活英雄聯盟盲僧最好皮膚是哪個
或許LOL玩家從一開始就有想到，英雄的至臻版皮膚以後會“爛大街”，現在确實有這種趨勢了，任何英雄出個新皮膚都想沾上“至臻”二字。拳頭在新版本中又發布了一些新皮膚，比如黎明和黑暗使者系列，糖果系列，以及海克斯系列的斯維恩。這篇的主角是我在美服... 2023-03-21
生活快手變異性濾鏡
快手變異性濾鏡?記者|肖芳編輯|文姝琪，今天小編就來說說關于快手變異性濾鏡?下面更多詳細答案一起來看看吧!快手變異性濾鏡記者|肖芳編輯|文姝琪“用xx借條把花呗還上！”今年，在一向講求價值觀的快手上，也出現了現金貸的廣告。内部員工一時嘩然。... 2022-11-16
生活回鄉偶書賀知章原文
回鄉偶書賀知章原文?原文：《回鄉偶書》，我來為大家講解一下關于回鄉偶書賀知章原文?跟着小編一起來看一看吧!回鄉偶書賀知章原文原文：《回鄉偶書》唐代：賀知章少小離家老大回，鄉音無改鬓毛衰。兒童相見不相識，笑問客從何處來。譯文：年少時離鄉老年才... 2022-06-01
生活吃一瓣榴蓮相當于吃十隻雞
相信大家對于榴蓮這種水果，應該是不算陌生的，榴蓮應該可以算得上，是一種比較典型的南方水果，其中所含的營養物質相對比較豐富，比如膳食纖維胡蘿蔔素，各種維生素，礦物元素，核黃素等等。日常生活中适當吃點榴蓮能夠給身體帶來很多好處，但是現實生活中不... 2023-03-14
生活速幹衣百科知識
現代社會，越來越多的人喜歡運動健身。可是每次運動完出一身汗，臭烘烘的不說，衣服也全濕了，粘在身上，小編深有體會。直到後來，小編入手了一件速幹衣後，這個問題就解決了。相信有很多人還不太明白速幹衣的原理，那麼今天，小編就帶大家來解析一下速幹衣。... 2023-01-28
生活資生堂百優眼霜好不好用
用過好幾款眼霜，韓妝和歐美品牌都用過，韓妝眼霜用完沒多大感覺，蘭蔻大眼精華，蘭蔻小黑瓶眼霜，雅詩蘭黛特潤眼霜，也換了一輪，還是覺得不太适合，直到用了百優三代，感覺不錯，很清爽，也沒有出現脂肪類，抹開很均勻，也很快能吸收，可惜由于疫情影響，價... 2023-03-20
生活微信改名字什麼時候生效
了解更多熱門資訊、玩機技巧、數碼評測、科普深扒，點擊右上角關注我們----------------------------------昨天，一則新聞開始在各大社交網站上流傳開來：騰訊為規避美國下載禁令，将微信的英文名Wechat改名為WeC... 2023-01-04
生活大蒜水培的種植方法
大蒜水培的種植方法?水培大蒜時的大蒜是不需要剝皮的，因為它在水培時是通過根吸收水分和營養，會在蒜的上部長出新鮮的蒜苗，蒜皮不會對它的生長産生不良影響而且不去皮還能防止蒜瓣中水分流失，對水培大蒜的生長更為有利，下面我們就來聊聊關于大蒜水培的種... 2022-06-06
生活夢見自己失眠什麼意思
夢見自己失眠什麼意思?夢見失眠，不用擔心，暗示你很清醒，有獨特的洞察力工作中會取得更多成績，得到提升，權力增加，我來為大家講解一下關于夢見自己失眠什麼意思?跟着小編一起來看一看吧!夢見自己失眠什麼意思夢見失眠，不用擔心，暗示你很清醒，有獨特... 2022-06-15
生活曆史劉備到底是怎樣的人
真正的曆史中的劉備是個什麼樣的人呢？相信大家都看過三國演義，三國演義中的劉備，看着就妥妥的一個愛哭鬼，這也不行，那也不行，動腦子你得靠諸葛亮，動武的話你得靠張飛，那他是昭烈帝，他是老大哥。這啥也不行，能做皇帝，你們信嗎？皇帝是什麼，一個國家... 2023-02-03
生活百用英語怎麼說
百用英語怎麼說?百的英語是hundred，英音[hʌndrəd]，美音[hʌndrəd]，接下來我們就來聊聊關于百用英語怎麼說?以下内容大家不妨參考一二希望能幫到您!百用英語怎麼說百的英語是hundred，英音[hʌndrəd]，美音[hʌ... 2022-06-04
生活産生死鎖的原因
産生死鎖的原因?解決死鎖的4種基本方法，今天小編就來說說關于産生死鎖的原因?下面更多詳細答案一起來看看吧!産生死鎖的原因解決死鎖的4種基本方法1、預防死鎖：通過設置一些限制條件，去破壞産生死鎖的必要條件2、避免死鎖：在資源分配過程中，使用某... 2023-02-18
生活我的世界如何玩生存模式
在玩我的世界這個遊戲的時候，很多人剛開始玩都會選擇玩生存模式。那麼新手玩生存模式的時候需要注意些什麼呢?讓我們一起看看吧。1.别開創造有些新手剛開始玩生存，玩了一會覺得難，就會開創造拿東西。開創造看似很過瘾，但實際上是最影響遊戲體驗的事情。... 2022-12-04
生活肖戰戴口罩洗手
現在很多晚會請了明星來唱歌，但很多明星都沒有真情實感的面對舞台，就算是現場再怎麼熱鬧，屏幕前的觀衆都能聽出有些人在渾水摸魚的假唱，其中有些還是專業的歌手，假唱這種事情不但是對觀衆不負責任，也是砸了自己的招牌，肖戰複出上舞台後，遭到了不少人嚴... 2022-11-13
生活香瓜種植時間和方法
香瓜種植時間和方法?種植時間：一般為2-3月份（春播），今天小編就來說說關于香瓜種植時間和方法?下面更多詳細答案一起來看看吧!香瓜種植時間和方法種植時間：一般為2-3月份（春播）。種植方法：選擇健康、品種優良的種子，用多菌靈對其進行浸種消毒... 2022-07-22

tft每日頭條

> 生活

> 高級語言作用域是如何實現的

高級語言作用域是如何實現的

相关生活资讯推荐

热门生活资讯推荐

网友关注