語言監測與智能學習?語言智能是人工智能的一個領域,主要關注人類語言的智能分析和處理,涉及語音識别、自然語言理解、自然語言生成、機器翻譯等領域近日,最能體現語言智能水平的ChatGPT引發各界的廣泛關注,人們懷着極大的興趣在讨論和嘗試着這項嶄新的技術成果或興奮,或迷茫或恐慌興奮的是語言智能技術真的使計算機能像人類一樣和我們自如地聊天解惑了,并且話語自如、有理有據,可以拒絕不合理的提問,效果如此之好,竟引發了轟動效應;惶恐的是ChatGPT具有超強的生成能力,不僅可以聊天,還可以寫文章、作詩、編碼程序等,這樣的話,ChatGPT就會代替人類和語言相關的工作和崗位,給人類生活帶來颠覆性變化;迷惑的是我們的語言智能研究下一步朝着哪個方向走?如何理性地分析ChatGPT取得的突破和主要不足?趕上或超越它的機會和落腳點在哪裡?對于語言智能的飛速發展,我們要有科學理性的态度,既要熱情擁抱人工智能的新發展,讓它更好地服務于人類社會,又要預防它帶給我們的消極影響,看到我們的不足和差距,迎頭趕上,接下來我們就來聊聊關于語言監測與智能學習?以下内容大家不妨參考一二希望能幫到您!
語言智能是人工智能的一個領域,主要關注人類語言的智能分析和處理,涉及語音識别、自然語言理解、自然語言生成、機器翻譯等領域。近日,最能體現語言智能水平的ChatGPT引發各界的廣泛關注,人們懷着極大的興趣在讨論和嘗試着這項嶄新的技術成果。或興奮,或迷茫或恐慌。興奮的是語言智能技術真的使計算機能像人類一樣和我們自如地聊天解惑了,并且話語自如、有理有據,可以拒絕不合理的提問,效果如此之好,竟引發了轟動效應;惶恐的是ChatGPT具有超強的生成能力,不僅可以聊天,還可以寫文章、作詩、編碼程序等,這樣的話,ChatGPT就會代替人類和語言相關的工作和崗位,給人類生活帶來颠覆性變化;迷惑的是我們的語言智能研究下一步朝着哪個方向走?如何理性地分析ChatGPT取得的突破和主要不足?趕上或超越它的機會和落腳點在哪裡?對于語言智能的飛速發展,我們要有科學理性的态度,既要熱情擁抱人工智能的新發展,讓它更好地服務于人類社會,又要預防它帶給我們的消極影響,看到我們的不足和差距,迎頭趕上。
一、ChatGPT的功能與不足
ChatGPT是由openAI研發的一種人工智能聊天機器人程序,它是基于GPT3.5架構的大型語言模型并通過強化學習進行訓練,可以和人類以自然語言對話的形式進行交互,還可以用于相對複雜的語言工作比如文本生成,自動問答,自動摘要等,同時具備一定的編寫和調試計算機程序的能力。ChatGPT 的出現是語言智能領域的一大進步,标志着語言智能技術可以融合于信息搜索、人機交互、對話生成等方面,應用場景的落地具有廣闊空間,潛力無窮。
首先,ChatGPT是一個基于深度學習的大規模預訓練對話模型,主要功能是對話聊天,它通過強化學習來理解提問者的話語意圖,能夠較好地引入人類反饋,具備主動承認錯誤,區分問題是否符合倫理要求,質疑不正确的問題等,并通過清晰的邏輯思路來組織話語,距離人類的聊天方式和口氣越來越近。相對于以前的對話系統,ChatGPT的主要突破在以下幾點:
(一)超強的生成能力可以完成多種任務。ChatGPT除了與人對話聊天外,還能按照輸入的關鍵詞和表達的意圖寫小說、寫論文、創作詩歌、作圖、編寫和糾正程序代碼。還可以用在教案生成、資料查詢、智能教學、智能創作和設計,在醫療、法律、教育、咨詢服務等領域具有廣闊應用前景。
(二)與搜索引擎相結合,基于海量數據,實現更為符合人類需求的查詢結果,實現交互式搜索,給用戶帶來全新的體驗
(三)交互能力大幅度提升。除了具有廣博的知識,它還能很好地組織自己的話語,思路清晰,邏輯嚴密,“因此”“而且”“但是”等話語連接詞使用恰當,幾乎接近人類語言的能力。還能主動承認錯誤,拒絕不合理的提問等等。
ChatGPT的主要功能在于提供信息和社交能力,有望成為人在精神陪伴,面對挫折困難的時候提供引導和安慰的幫手。總之,ChatGPT已經成為互聯網時代的語言智能的技術領跑者,給人類社會帶來更加智能化和便捷化的服務。
當然,作為一種新興人工智能模型,ChatGPT也存在一些問題和不足,主要在于:
(一)盡管對話能力和交互能力大幅度提升,但經常出現事實性錯誤。由于它是數據驅動的模型,對于數據背後的真實世界的狀态,原理和規則等缺乏足夠的認知,因此會出現一本正經地胡說八道情況。不符合常理的話語會經常出現。
(二)對于一般知識了解廣泛,但無法提供專業性較強、有深度、有洞見的問題答案。例如對它進行物理學測試,簡單常識性問題回答較好,越是難度增加,答案不能令人滿意。說明ChatGPT掌握的知識并不深入、不專業。
(三)基于多層複雜神經網絡搭建的深度學習模型,目前還不能解釋其算法邏輯,經常出現事實性錯誤,産出的結果不具有安全性保障。如果被惡意利用,将造成嚴重的安全隐患,或危害法律。
二、ChatGPT 的工作範式
ChatGPT是一個基于transformer神經網絡架構和生成預訓練技術的大型語言模型,通過對超大型文本語料的訓練,來獲得語言知識和世界知識。同時它還引入基于人類偏好的強化學習方法,将其應用于自然語言建模。訓練的語料,除了海量無标注數據,ChatGPT還利用标注精細的專門語料庫,訓練機器更高的适應性和更準确的知識。這些知識是怎麼被機器獲得和輸出的呢?ChatGPT使用的transformer神經網絡結構對數據進行訓練,可以輸入序列,将其轉化為對應的輸出序列,知識是通過神經網絡訓練得到的。在訓練過程中,ChatGPT使用了海量的自然語言文本數據來學習單詞的嵌入表示,以及上下文之間的關系,這些知識被編碼在神經網絡的參數中,輸出的結果都生成于這些參數之中。收到用戶的問題時,ChatGPT會将其輸入到神經網絡中,神經網絡會根據它學到的知識回答問題,反饋給用戶。超強的記憶力是它的重要特征。ChatGPT作為一個現象級的技術産品,在生成内容方面無疑是革命性的,代表着人工智能大模型加大數據範式方法的成功,也說明采用統計模型方法模拟人類語言智能的新發展。ChatGPT在大模型的基礎上,采用人類反饋強化學習的訓練機制和提示引導模式,促使模型逐漸順應人類思考邏輯,趨向人類認知和習慣,這是它的一大創新。
三、對未來語言智能走向的影響
ChatGPT除了對人類生活帶來影響,對語言智能領域的研究範式和發展走向也會帶來巨大的沖擊。從大量的語言數據中學習,挖掘語言規律和語義關系,極大地改進了自然語言理解和生成的質量,取得驚喜的使用效果,使我們對大語言模型有了新的認知和思考:大模型範式是否成為未來語言智能的主流技術?學術界和企業界從事多年的自然語言處理研究還需要繼續搞下去嗎?ChatGPT會給AI領域的研究帶來怎樣的影響?
預訓練模型的出現代表了自然語言處理技術的飛躍,減少了對特征工程的依賴,逐漸帶動整個領域研究範式的轉變。這種範式轉變帶來的影響主要體現在:
一是自然語言處理研究子領域的逐漸弱化,例如詞性标注、命名實體識别、句法分析、指代消解等問題,它們在大模型 大數據獨領風騷的背景下,将會逐漸失去吸引力,甚至被淡忘和遺棄。
二是自然語言處理不同子領域的技術方法和技術框架日趨統一。多少年來,為了讓機器理解人類語言,人們想盡各種方法來标注詞性,理解語義。ChatGPT的出現,讓人們看到了語言預訓練模型威力,通過這種範式處理自然語言效果會更好。
第三,從全球語言智能的發展來看,大模型範式的一路領航勢必導緻技術、資源、用戶的高度趨合,最終走向技術和資源的單極壟斷。
四、未來發展
盡管ChatGPT在智能交互方面獲得驚人的能力,但它畢竟是一個預訓練語言模型,基于預存知識和模型回答問題,并不具備真正的理解能力和創造能力,不能理解自己輸出的内容。面對語言智能的新發展和新挑戰,未來可以着重考慮以下幾個着力點。
(一)深度學習模型的優化。結合人類語言習得,語言使用規律和習慣,推進深度學習模型研究,提高語義理解能力,更好模拟人類語言能力。
(二)多模态語言理解與生成。随着多模态數據的不斷增加,如何在多模态語言理解任務中有效融合多種信息來源,提高語言理解的準确性是當前語言智能研究的一個重要方向。ChatGPT主要是文本的自動生成,多模态的語言理解和生成問題尚未完全解決。需要未來深入研究多模态學習和多模态生成技術。
(三)領域知識圖譜的構建。雖然ChatGPT可以搜索衆多信息,對一般問題回答較好,但相對有深度和專業性較強的問題卻表現得力不從心。如何更好地利用知識圖譜的語義信息,提高自然語言處理任務的準确性,更好地服務于各類專業性用戶,也是未來可以發展的一個領域。
(四)加強人工智能倫理和數據安全等問題的研究。ChatGPT是生成型人工智能,不是簡單地分析和處理數據,很可能會引發道德和法律方面的違規行為。比如,對信息數據來源無法進行事實核查,存在個人數據和商業秘密洩露,或提供虛假信息的隐患。學生使用ChatGPT寫論文是否算抄襲等等,因此加強科技倫理研究,建立數據安全法規的約束機制,增強人們對技術變革的現代智慧是非常迫切的任務。
作者:李佐文,系北京外國語大學人工智能與人類語言重點實驗室教授、博士生導師
來源: 光明網
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!