ai在語言學習中的應用-tft每日頭條

ai在語言學習中的應用

生活更新时间:2026-07-09 07:12:33

ai在語言學習中的應用（自然語言理解新突破）1

智東西（公衆号：zhidxcom）

編譯 | 貞逸

編輯 | 雲鵬

智東西7月20日消息，據外媒報道，近日，倫斯勒理工學院的兩位科學家撰寫了一本名為《人工智能時代語言學（Linguistics for the Age of AI）》的書。

該書探讨了目前的人工智能學習方法在自然語言理解 (natural language understanding，NLU) 中的瓶頸，并嘗試探索未來發展智能代理（intelligent agents）的途徑。

《人工智能時代語言學》的作者 Marjorie McShane 和 Sergei Nirenburg發現了一種突破人工智能學習語言瓶頸的新方法，并稱為“語言賦能智能體（Language endowed intelligent agents，LEIA）”。該方法能在減少訓練模型數據量的情況下，進一步提升人工智能理解人類語言的準确性。

他們認為，人工智能系統必須超越對詞語字面意思理解的範疇。他們在書中用案例顯示了，自然語言理解系統能夠幫助人工智能理解世界、向人類解釋他們的知識并在探索世界的過程中學習。

ai在語言學習中的應用（自然語言理解新突破）2

《人工智能時代語言學》

一、AI學語言的兩種方法：被動告知or主動學習？

例如一個歧義語句的案例：“開刀的是她父親”。這句話有兩種理解方式，她的父親是醫生去操作開刀手術，或者她的父親是被醫生開刀的患者。

有些語句單獨看充滿了歧義，但人類能夠通過語境來解決這些歧義。我們通過說話者的語氣、語境和對話的一般邏輯以及生活基本常識的線索來構建上下文。當我們的直覺和知識未能幫助我們理解句子的時候，我們會提出疑問。對我們（人類）來說，确定上下文的過程是很容易的。但是讓計算機用程序思維來理解相同的過程并不簡單。

科學家提出了兩種方式來嘗試解決這個問題。

第一種方式是科學家在人工智能發展的初期使用的。科學家通過知識庫（Knowledge-based）系統來确定句子中的每一個單詞的作用，并提取上下文的含義。但知識庫系統依賴大量的關于語言、情境和世界的特征（features）。這些信息可能有着各自的來源，并且（在計算機中）需要獨立的計算方式。

知識庫提供了可靠（reliable）和可解釋（explainable）的語言分析方法。但後來它們逐漸“失寵”了，因為它們需要太多的人力來設計特征、創建詞彙結構（lexical structures）和本體（ontologies），以及開發将所有這些部分結合在一起的軟件系統。研究人員認為知識工程（knowledge engineering）的瓶頸是手動工作（manual effort，大量的人工操作且不能窮舉所有結果），他們嘗試尋求其他方法來進行語言處理（language processing）。

“公衆認為任何試圖克服這種所謂的知識瓶頸的努力都是徒勞的，這深刻影響了人工智能的發展道路，特别是自然語言處理，使該領域遠離了理性主義、基于知識的方法，并促成了經驗主義的出現。”McShane和Nirenburg在《人工智能時代的語言學》中寫道。

近幾十年來，機器學習算法（machine learning algorithms）已經成為神經語言程序學（Neuro-Linguistic Programming，NLP）和自然語言理解（Natural Language Understanding，NLU）的核心。

部分科學家逐漸開始使用第二種方式，利用知識學習系統（knowledge-lean systems）來訓練機器學習模型，使人工智能通過統計關系來處理語境問題。在訓練過程中，機器學習模型需要處理大量的文本資料，并根據單詞與單詞相鄰位置的方式來調整其參數。在這些模型中，語境是由單詞序列之間的統計關系決定的，而不是單詞背後的含義。不過，數據集越大，例子越多樣化，這些數字參數就越能捕捉到單詞彼此之間的各種出現方式（能夠記錄單詞與單詞的排列參數）。

知識學習系統之所以得到普及，主要是因為大量的計算資源和大型數據集可以被用來訓練機器學習系統。通過維基百科等公共數據庫，科學家們已經能夠收集龐大的數據集，并針對翻譯、文本生成和問答等各種任務，設置機器學習的專項訓練。

二、機器記錄了數據并不意味“理解”了數據

今天，我們的深度學習模型可以生成文章長度的文本序列，回答科學考試問題，編寫軟件源代碼以及回答基本的客戶服務查詢。這些領域之所以能取得進展，是因為深度學習架構（LSTMs，Transformers）得到了改進。更重要的是，神經網絡研究每年都有新的進展。

但是，雖然更大的深度神經網絡可以在特定任務上逐步取得進展，但它們并不能解決“通用自然語言理解（general natural language understanding）”這一更寬泛的問題。這就是為什麼各種實驗表明，即使是最複雜的語言模型也無法回答有關世界是如何運作的簡單問題。

在McShane和Nirenburg的書中，他們把目前人工智能系統解決的問題描述為“唾手可得的水果（low-hanging fruit）”任務。一些科學家認為，繼續沿着神經網絡的道路前進，最終會解決機器學習正面的語言學問題。但McShane和Nirenburg認為，還有更根本的問題需要解決。

“當前的系統不像人類，它們不知道自己在做什麼以及為什麼這樣做。它們解決問題的方法也不像人類，而且它們不依賴于世界、語言或機構的互動。”他們寫道，“相反，它們在很大程度上依賴于将通用機器學習算法應用于越來越大的數據集，并得到現代計算機驚人的速度和存儲容量的支持。”

ai在語言學習中的應用（自然語言理解新突破）3

人工智能

三、真正了解學習意義的AI才真“智能”

身為認知科學家和計算語言學家的McShane表示，機器學習必須克服幾個障礙，其中首先是意義的缺失（真正讓計算機了解學習的意義，而不是單純的背答案）。

“統計/機器學習（The statistical/machine learning，S-ML）方法并不試圖計算意義（compute meaning）（目前的計算機學習僅能進行數據處理，并不能真正理解數據的含義）。”McShane說。“從業者（部分研究人員）認為單詞（在句子中）足夠代表它的含義，但事實并非如此。當涉及到完整的上下文意義時，一個句子中的單詞（意思）隻是冰山一角。對人工智能來說，混淆詞語的含義就像把船開向冰山一樣令人擔憂（人工智能在不能完全正确理解語言指令含義的時候，會導緻後續的一系列錯誤）。”

在大多數情況下，機器學習系統通過縮小任務範圍或擴大數據集來回避處理詞義的問題。但是，即使一個大型的神經網絡能夠“創作”一段長文本并保持語義的連貫性，它仍然不能理解它所“寫”的詞句的含義。

“人們可以搭建一個看起來十分“智能”的系統，但實際上它們（人工智能）并不知道發生了什麼（例如，GPT-3）。”McShane說。

ai在語言學習中的應用（自然語言理解新突破）4

GPT-3

所有基于深度學習的語言模型，隻要你問它們一系列瑣碎但相關的問題，它們就會開始崩潰，因為它們的參數無法捕捉日常生活中無限的複雜性。在這個問題上投入更多的數據并不能讓它們變得更加“智能”。

四、賦能AI突破語言學習的瓶頸

在他們的書中，McShane和Nirenburg提出了一種不需要求助于純機器學習（純機器學習需要大量數據），而且解決了自然語言理解的“知識瓶頸”的方法，它被稱為“語言賦能智能體（LEIA）”。它有三個關鍵特征:

1.LEIAs能夠理解敏感語境下的語言含義，不至于造成歧義。

2.LEIAs可以向人類解釋它們（AI）的思想、行動和決策

3.LEIAs能夠在與“世界”互動中終身自主學習，減少人類對其擴展知識庫的需求。

LEIAs對自然語言進行了六個階段的處理，從确定單詞在句子中的作用，到語義分析，最後到情景推理。這些階段使得LEIA能夠解決單詞和短語不同含義之間的沖突，并将句子整合到主體工作的更廣泛的環境中（将句子的表達方式調整的更像人類的語言）。

LEIA為它們的語言表達設置了信心水平，并知道它們的技能（語言技巧）和知識在哪裡達到了它們的極限。在遇到理解力的極限的情況下，它們能與人類(或其他高等智能)進行交互以解決語言歧義的問題。這些互動反過來使它們能夠學習新事物，擴大它們的知識儲備。

LEIA将句子轉化為文本意義表述（text-meaning representations，TMR），即句子中每個詞的可解釋和可操作的定義。根據其（語句）背景和目标，LEIA決定哪些語言需要跟進處理。例如，如果一個維修機器人與幾個人類技術人員處在同一個機器維修的車間，而人類在讨論昨天的體育比賽結果，那麼人工智能應該能夠區分與它的工作（機器維修）相關的句子和它可以忽略的句子（體育）。

LEIAs主要使用knowledge-based systems，但它們也在處理語言的過程中使用了機器學習模型，特别是在語言處理句子解析的初始階段。

五、AI真的需要模拟人類大腦思維嗎？

LEIA的主要特點之一是整合了知識庫（knowledge bases）、推理模塊（reasoning modules）和感覺輸入（sensory input）。目前，計算機視覺（computer vision）和自然語言處理等領域的重疊很少。

正如McShane和Nirenburg在他們的書中所指出的，“語言理解不能脫離整體認知（overall agent cognition），因為語言理解有時也需要其他感知模式（如視覺）的輔助。

在現實世界中，人類利用豐富的感官體驗來填補語言表達的空白（例如，當有人告訴您“看那邊？”時，他們假設您可以看到他們的手指指向的位置，并補充信息）。人類對話的思維邏輯能做出假設并省略語言中的細節。我們希望與我們交互的智能代理（intelligent agent）都具有類似的功能。

“我們完全理解為什麼單獨處理的方式（silo approaches）是現在的常态，畢竟解決每一個問題都很困難，而且每個問題都需要單獨進行研究，”McShane說。“然而，如果不進行整合，問題是無法從根源解決的（人工智能語言學習的發展應該整合多個模式）。”

同時，實現類似人類的思考邏輯并不要求LEIA完全複制人類大腦。McShane說：“至少在這個發展階段，神經科學（neuroscience）不能為我們的認知建模（cognitive modeling）提供任何語法上和内容上的幫助。”McShane和Nirenburg認為，複制大腦并不能為人工智能解釋目标（語句）所服務。

ai在語言學習中的應用（自然語言理解新突破）5

人工智能2

結語：讓AI像人一樣使用語言仍需時間

McShane和Nirenburg提出了LEIA作為新的人工智能學習方法，這不僅減少了訓練所需的數據量，而且解決了自然語言理解存在的“知識瓶頸”問題。

同時，他們也承認開發LEIA是一個持續的、長期的、範圍廣泛的工作計劃，有很多工作需要做。而最終的目标就是“使機器能夠像人類一樣熟練地使用語言”。

來源：venturebeat

ai在語言學習中的應用（自然語言理解新突破）6

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活湖南大學生三下鄉活動有哪些地點
湖南大學生三下鄉活動有哪些地點?湖南日報·新湖南客戶端(通訊員劉歆昱譚怡蕊羅心陽)近日，湖南工學院土木與建築工程學院組織鄉村振興實踐團赴衡南縣開展暑期“三下鄉”社會實踐活動實踐團通過實地考察、走訪和座談會等方式，調研土枇杷種植及相關産業鍊現... 2022-12-07
生活小龍蝦盡量别這麼吃
小龍蝦盡量别這麼吃?夏天的快樂來了——吃小龍蝦小龍蝦之美味，恐怕是為大多數人所公認的關于小龍蝦，你了解多少？據說小龍蝦喜歡污水溝？小龍蝦的蝦黃到底能不能吃呢？在外面吃小龍蝦老擔心不夠幹淨，自己在家怎麼做小龍蝦？，現在小編就來說說關于小龍蝦盡... 2022-12-05
生活複仇者聯盟3绯紅女巫消失
《複仇者聯盟3》的故事已經落幕，但是影片當中的很多畫面依然在我們的腦海中回蕩，印象最為深刻的便是滅霸同超級英雄們的輪番打鬥，敵我之間展開的各種華麗的招式，讓觀衆們目不暇接，即便超級英雄們最終輸了，但它們的抗争精神依然可敬。不過，在這些超級英... 2023-01-14
生活論語全文及譯文完整版閱讀
内容簡介：《論語》這本書所宣講、所傳布、所論證的那些“道理”、“規則”、主張、思想，已代代相傳，長久地滲透在中國兩千年來的政教體制、社會習俗、心理習慣和人們的行為、思想、言語、活動中了，已成為規範整個社會活動和人們行為的準則和指南，還作用于... 2023-03-13
生活喝黑芝麻可以治療白發嗎
文/養生指南君！無論男性還是女性，擁有一頭烏黑濃密的頭發是保證顔值的基本條件，但随着大家生活節奏加快，越來越多的年輕人出現了長白頭發的情況，小張就是其中之一。白頭發越拔越多，吃黑芝麻能減少白發嗎？‍小張最近工作上接到了一個新項目，為了完成好... 2022-11-10
生活榮耀v20有殘影嗎
2018年12底發布的榮耀V20一經發布，就被不少網友譽為2018的最後一個“真香機”，最便宜的麒麟980、4000mAh大電池22.5W保證續航、4800W的索尼IMX586也讓拍照有了明顯提升。但是榮耀V20的屏幕卻引起了不小的争議，很... 2023-02-13
生活前任不理你怎麼讓她注意到你
在這些年的咨詢經曆中，我聽到過最多的問題就是："我現在想複合，但找他聊天吧，又不知道該怎麼開口。咋辦？"我覺得你會有這個顧慮，原因無非就兩點。第一，你擺不正你現在的位置；第二呢，就是你這人壓根就不會聊天。分手後找前任聊天的時... 2023-01-25
生活魅族19x配置曝光
魅族近日的熱度相當高，并不是因為魅族19系列即将來臨，而是因為收購傳聞已被确認，這也是魅族上半年沒有發布任何新機的主要原因。很多用戶擔心魅族以後專注造車，直接放棄手機市場。從各方消息來看，魅族手機并不會絕迹，将持續深耕手機市場，魅族19系列... 2023-02-13
生活蓮藕孔裡面黑怎麼清理
蓮藕孔裡面黑怎麼清理?先将蓮藕兩頭的藕節切掉,将蓮藕的孔洞暴露出來,放在清水裡浸泡一段時間，下面我們就來說一說關于蓮藕孔裡面黑怎麼清理?我們一起去了解并探讨一下這個問題吧!蓮藕孔裡面黑怎麼清理先将蓮藕兩頭的藕節切掉,将蓮藕的孔洞暴露出來,放... 2022-06-08
生活二十四節氣歌歌詞
聞鍾記郵（3336）冬雪雪冬小大寒随着11月8日立冬節氣的達到來，正式進入了冬天，每15天一個節氣，經曆立冬、小雪、大雪、冬至、小寒、大寒六個節氣的輪換，直至立春，開啟下一個二十四節氣的輪回。冬雪雪冬小大寒是傳統的節氣歌中的一句，七個字卻包... 2022-11-14
生活佛珠念珠排行榜
5mm牛骨念珠，從包漿可以看出珠子并不算短的曆史。搭配了老松石和有機寶石，都是讓人舒服的顔色。骨制品盤玩得久了會逐漸呈現玉化的狀态，這也是骨珠所能帶來的樂趣，揉骨成玉，寶光潤膩，恐怕是玩骨者追求的最高境界了。為什麼要用骨制念珠？骨頭代表生命... 2022-12-29
生活橡皮樹的養殖方法和注意事項是什麼
橡皮樹的養殖方法和注意事項是什麼?以下是橡皮樹的詳細養護方法：橡皮樹又名印度榕、印度膠樹株内有乳汁，葉寬大，厚革質，幼芽紅色喜溫熱濕潤的氣候，喜充足的光照，亦耐陰生長适溫為20—25℃，現在小編就來說說關于橡皮樹的養殖方法和注意事項是什麼?... 2022-06-07
生活怎麼去讀懂現代詩
怎麼去讀懂現代詩?當有人呼籲“請讀現代詩”時，很多人會自動放棄自己進入現代詩的權利，因為“現代詩”在許多人眼裡成了難懂的代名詞我在2011年開始講授詩歌寫作課之前，也曾認同上述讀者的做法，那時作為一個詩人，為了維護寫作的純粹，是不願意當衆談... 2022-12-20
生活如何提高十公裡跑步成績
對很多跑者來說，10公裡是一個神聖的距離。剛開始跑的時候10公裡有點望塵莫及，而堅持跑步一年以上時，十公裡就成了每天的标配。因此，不管是初入馬拉松圈的跑步小白，還是馬拉松國家一級以上的高手，都離不開一個衡量數據——跑量。于是，大部分跑友逐步... 2022-10-31
生活走在春風中
走在春風中?公園的一角有一條彎彎曲曲的鵝卵石路，我在這條石子路上，走過了春的浪漫，走過了夏的繁華，如今又正走在秋的冷風裡，現在小編就來說說關于走在春風中?下面内容希望能幫助到你，我們來一起看看吧!走在春風中公園的一角有一條彎彎曲曲的鵝卵石路... 2023-02-17
生活洪慶山上演速度與激情
槐香洪慶·第四屆山地自行車越野賽、越野摩托車場地賽舉行。西部網訊今天（5月7日）上午，槐香洪慶·第四屆山地自行車越野賽、越野摩托車場地賽在美麗的洪慶山國家森林公園舉行。據了解，本次比賽共設置男子青年組、男子中年組、女子組3個組别。近千名戶外... 2023-01-01
生活俄羅斯線上授課
【環球時報綜合報道】“俄羅斯中小學生可以通過在線方式學習漢語了。”《俄羅斯報》11日報道稱，俄羅斯教育部新聞處10日宣布，在“俄羅斯電子學校”項目框架下，教育部首次針對俄羅斯中小學生推出了漢語在線課程。該課程專為“俄羅斯電子學校”設置，面向... 2022-11-05
生活馬桶堵住了該怎麼疏通
馬桶堵住了該怎麼疏通?開水加上洗潔精；如果是油污油脂導緻的馬桶堵塞，先燒一鍋開水，然後往馬桶坑内倒入洗潔精，靜置2分鐘後，将一鍋開水往坑内倒由于洗潔精有很好的溶解堵塞油脂效果，而開水可以提高洗潔精的活性，加速分解效果，接下來我們就來聊聊關于... 2022-07-10
生活幹皮濕敷最好的方法
幹皮濕敷最好的方法?Hi，我來啦~說起換季很多人會第一時間想到換護膚品，因為皮膚狀态發生了變化，需要準備換季的一套護膚品，不過你是否知道遇到皮膚趕走起皮怎麼處理呢？，下面我們就來聊聊關于幹皮濕敷最好的方法?接下來我們就一起去了解一下吧!幹皮... 2023-01-21
生活科目三模拟燈光的正确使用方法
是新朋友嗎？記得先點藍字關注我哦～燕趙駕校培育中國好司機貢獻社會正能量小夥伴們，今天又是周六了該好好學知識，準備考駕照啦很多小夥伴說科二小知識很管用科目三的模拟燈光有沒有好的訣竅必須安排上模拟燈光可以說是科目三考試中比較簡單的一項但也是很容... 2023-01-21
生活南甯市食品衛生許可證辦理流程
食品經營衛生許可證是衛生許可證的一個類别之一，是國家衛生主管部門對食品生産與經營者頒發的允許進行食品生産經營的法定證件。開店必備證件，無證經營，被發現會被罰款哦~老闆們都申請許可證了嗎？在沒有辦理許可證下經營的企業,被查出來的話，後果很嚴重... 2022-12-21
生活機場燃油附加費降
7月5日起，國内航線燃油附加費收取标準上調：800公裡（含）以下航段，每位旅客收取人民币100元；800公裡以上航段，每位旅客收取人民币200元，這已經是國内航線燃油附加費今年的第五次上漲。坐過飛機的旅客都知道，機票完整價格包括機票票面價格... 2022-10-29
生活補鐵最好的食物是菠菜嗎
孩子如果身體缺乏鐵元素，就容易缺鐵性貧血，變得精神不振、沒有活力。孩子身體的抵抗力還會下降，更容易患各種感染性疾病，每次一有流行性感冒，孩子就生病了。對孩子的大腦發育也不好，導緻孩子智力下降。所以很多媽媽就會給孩子吃很多含鐵豐富的食物補充鐵... 2023-02-25
生活涼菜龍須菜怎麼種植
這種蔬菜北方吃果實，南方卻吃嫩苗人稱“龍須菜”，你們那吃什麼中國飲食文化曆史悠久，源遠流長，在廣闊的中國大地，各地的飲食都不盡相同，北方人喜歡吃面食，南方人喜歡吃大米，廣西廣東喜歡吃稀飯，湖南，湖北，江西等地喜歡吃幹飯。在我們的衆多的菜譜當... 2022-11-27
生活艾草種子怎麼種
艾草種子怎麼種?艾草種子的種植有兩種方式，分别是根狀莖繁殖和種子繁殖，這兩種方法都是比較常見的，而且操作起來也很簡單詳情請緻電長景種業，現在小編就來說說關于艾草種子怎麼種?下面内容希望能幫助到你，我們來一起看看吧!艾草種子怎麼種艾草種子的種... 2022-06-15
生活西亞有哪些國家
西亞有哪些國家?西亞包括的國家有伊朗、伊拉克、阿塞拜疆、格魯吉亞、亞美尼亞、土耳其、叙利亞、約旦、以色列、巴勒斯坦、沙特、巴林、卡塔爾、也門、阿曼、阿拉伯聯合酋長國、科威特、黎巴嫩、塞浦路斯、阿富汗共20國，我來為大家科普一下關于西亞有哪些... 2022-07-06
生活驢皮是制阿膠的必需品嗎
春節快到了，很多人喜歡買些像阿膠這樣的傳統滋補品來自己服用，或作為禮物送給家裡的親戚長輩。但你知道嗎？市面上銷售的阿膠可能有假。去年10月，本報曾推出《“阿膠”變“馬皮膠”？半數阿膠查出馬皮成分》的報道，曝光了一個行業“公開的秘密”——用馬... 2022-12-23
生活哈利波特台配版伏地魔
1905電影網訊9月26日，據外媒報道，《哈利·波特》的番外短片《岡特家族——伏地魔的起源》發布海報。法國演員馬克桑斯·達奈-弗偉爾變身伏地魔，手持魔法棒以側顔出鏡，戴着極為顯眼的挂墜。在2018年，曾有一部關于伏地魔的粉絲電影《伏地魔：傳... 2022-11-05
生活哮喘為什麼能治好
哮喘是一種慢性疾病，患上哮喘的病人往往會長期受到病痛的折磨，讓病人非常苦惱，很多患者都希望自己的哮喘能夠根治，不在發作，但是我們知道這種慢性疾病一旦患上就是無法根治的，但是患者們也不能因此而放棄治療，哮喘疾病若不積極治療，其對病人生活質量的... 2023-02-03
生活人生苦短是什麼意思
人生苦短是什麼意思?人生苦短，意思是說苦于人生太短，這是一個倒裝句，苦在此并非形容詞和去日苦多一樣，并不是說過去的時間苦日子多，而是苦于人生過于短暫沒有好好珍惜時間，我來為大家講解一下關于人生苦短是什麼意思?跟着小編一起來看一看吧!人生苦短... 2022-06-09

tft每日頭條

> 生活

> ai在語言學習中的應用