去年11月以來,一款名為“ChatGPT”的聊天機器人程序開始在海外爆火,到今年2月份,ChatGPT更成為幾乎每天都能見到相關熱搜的“頂流”。
熱烈的讨論聲中,很多人驚呼:“《流浪地球2》裡那個不斷自我學習,最終演化出自主思維的‘MOSS’,或許離我們已經不遠。”
也有人認為,ChatGPT與Siri、小愛同學、小度等人們熟悉的智能助手沒有本質區别,不值得過多關注。
網友讓它寫詩、寫小說、寫工作簡報、寫朋友圈文案,甚至用它寫代碼、寫論文……ChatGPT究竟是一款怎樣的産品?它緣何突然爆火?它能做到哪些事情?會有人因此被“搶飯碗”嗎?未來發展将走向何方?我們采訪到業界專家和多位ChatGPT使用者,試圖解答這些問題。
“不是新東西”的ChatGPT
突然就火了?
ChatGPT,全稱是“Chat Generative Pre-trained Transformer”,可直譯為“作交談用的生成式預先訓練變換器”。它是美國公司OpenAI研發的聊天機器人程序,能用于問答、文本摘要生成、機器翻譯、分類、代碼生成和對話AI。
到今年1月,ChatGPT僅用不到兩個月時間,就累計了超過1億用戶,打破了此前Tik Tok用九個月時間将用戶數累計到1億的速度。
南開大學計算機學院、網絡空間安全學院副院長劉曉光表示,雖然ChatGPT進入大衆視野的時間并不長,但OpenAI的GPT産品幾年前就已在從業者中産生巨大影響。從技術層面來說,ChatGPT并不是個新東西。
“2016—2020年,OpenAI陸續發布了GPT的1.0、2.0、3.0版本,去年11月底發布的ChatGPT可以視作GPT-3.5。雖然大多數普通人是最近才知道‘GPT’這種利用大數據的預訓練大模型,但更早的GPT-3已經在計算機學界和業界産生很大的影響。國内一些互聯網公司早在這波熱潮前,就擁有自己的預訓練大模型項目。”
劉曉光認為,ChatGPT之所以能夠突然爆火,可能有這樣幾個原因:“一是此前幾代GPT更多是面向商界提供技術支持,而ChatGPT則是直接面向大衆,誰都可以提問,回答也隻需等幾秒,更多的人能簡單而直觀地了解它的作用;二是它發布時正值國外的大學考試季,很多學生拿它寫論文、交作業,而ChatGPT能給出相對完整的回答,解決了學生的實際問題,由此迎來用戶快速增長。當然,它火熱到一定程度後,也不排除有科技巨頭企業、科技媒體的過度關注和一些炒作現象。”
“好得吓人”?
ChatGPT突破了怎樣的難點?
去年12月,埃隆·馬斯克曾公開表示ChatGPT“好得吓人”(scary good),并認為強大到危險的人工智能已經離我們不遠。微軟聯合創始人比爾·蓋茨接受媒體采訪時表示:“ChatGPT将改變我們的世界。”近日,京東集團副總裁何曉冬接受媒體采訪時表示:“ChatGPT是第一款真正意義上的人工智能原生的産品,就像第一款iPhone,一出來就展現出高完整度,高體驗性,高平台性。”
埃隆·馬斯克稱ChatGPT“好得吓人”
行業巨頭為何如此高度評價ChatGPT?很多人表示不解。有網友在互聯網中提問:“能與人對話的Siri、小愛同學、小度等智能助手已然不少,若論及AI技術,幾年前的阿爾法圍棋(AlphaGo)也曾引發極大關注,ChatGPT究竟特殊在哪裡?”
劉曉光表示,在不少計算機領域業内人士看來,ChatGPT的橫空出世,給AI領域帶來的沖擊,更甚于七年前的AlphaGo與圍棋世界冠軍、職業九段棋手李世石進行并獲勝的那場圍棋人機大戰。
“從30年前IBM開發的國際象棋電腦‘深藍’戰勝世界冠軍卡斯帕羅夫,到幾年前AlphaGo戰勝人類圍棋冠軍,其間雖有算法、算力的巨大差異,但本質上仍沒有跳出‘讓計算機在固定場景下幹固定的事’這個範疇,而這恰好是計算機最擅長做的事。”劉曉光介紹道,“而ChatGPT面對的是一個‘open world’——上億用戶要問它什麼問題,完全是不可預知的。ChatGPT需要根據具體場景,自行組織各種回答。這恰恰是AI開發的難點,而ChatGPT在很多時候表現得很好。”
關于“open world”場景下AI運作之難,劉曉光做了一個簡單類比:“如今的智能駕駛技術大多仍應用于礦山、港口和室内工廠等特定的封閉環境,這種‘close world’不會讓AI遇到太複雜的問題。相對的,公共道路上的智能駕駛則難實現得多。其中一個原因,就是AI面對開放的、不可預知的環境時,其運作難度指數級上升。”
劉曉光認為,從核心概念來看,ChatGPT相比于Siri、小愛同學、小度等智能助手,其本質仍是語言模型,核心技術并沒有颠覆性創新。區别在于,ChatGPT的模型足夠大、有更多的數據以供訓練、處理數據的軟硬件能力更強,而Siri、小愛同學等軟件的學習能力、數據量都要差很多,甚至可以說是質的差别。
“ChatGPT在學習能力、數據處理量上的優勢,讓它所能處理問題的邊界大大拓寬,甚至可以說,它是一款完全不同的産品。有研究者的觀察分析表明,ChatGPT已展現出一個接受過大學教育的普通本科生的知識水平。這與此前同類産品有着雲泥之别,也是讓業界震驚的地方。”
一場“調戲”ChatGPT的狂歡
圍觀機器人“一本正經地胡說八道”
值得注意的是,ChatGPT在中文互聯網爆火後,很快引發了一場意料之外的狂歡——用戶們争先恐後地“調戲”它。
與蘋果的智能語音助手Siri遇到複雜問題時動辄回答“對不起,我好像不太明白”不同,ChatGPT展現着一種盡可能用自身邏輯組織語言、回答問題的傾向。甚至對很多人們一眼看上去像是在搞怪的問題,它也會給出答案。這種“一本正經地強答”,讓用戶産生了極大興趣。
一些“強答”反映了ChatGPT有時并不能完全理解自己所回答的問題。例如,當問及“為什麼房子不蓋成實心的”時,ChatGPT會“不厭其煩”地從空氣無法流動、沒有通風系統等方面論述這樣的房子對健康不利,但似乎沒有“意識”到這樣的房子本就無法住人。
網友“調戲”ChatGPT的問題(圖片來自網絡)
涉及專業知識類的問答,同樣鬧出了不少笑話。B站一位曆史區up主詢問ChatGPT幾個問題後得到的答案顯示,ChatGPT會混淆春秋戰國時期七雄之一的魏國、三國時期割據政權之一的曹魏,以及十六國時期鮮卑拓跋氏建立的北魏。無獨有偶,ChatGPT還會将“南朝宋”與“南宋”張冠李戴。
ChatGPT“一本正經地胡說八道”(圖片來源:b站up主“稚嫩的魔法師”)
由此導緻的結果,往往是亂答一通。一位曆史學博士告訴記者,這些“一本正經地胡說八道”的答案固然好笑,但奇怪的是,它的回答在邏輯表達上卻似模似樣,不像是随意從網上抄來的,“我看到有人使用ChatGPT問一些學術問題,它給出的答案甚至包含了引用論文、論文号等等細節,結果一查,這些‘參考文獻’全是chatGPT自己編的,讓人啼笑皆非。真不知道它是怎麼得出這種答案的。”
“要讨論ChatGPT‘胡說八道’的緣由,就不得不提到此類産品目前的一個缺陷,就是可解釋性很差——預訓練大模型中的神經網絡存在成千上萬層,AI通過深度學習,自行構造出一個複雜規則。人們能看到的,往往隻是它針對問題所輸出的一個結果。因此,無論答案是正确還是錯誤,人們都很難對AI為何得出該答案進行解釋。”劉曉光說道。
多位使用過ChatGPT的用戶告訴記者,ChatGPT的回答很少出現“句不成句”式的表述硬傷,但卻不時出現邏輯與事實錯誤。越冷門、越小衆的領域,這種錯誤就越明顯。
出現這種現象,或與ChatGPT所學習、訓練的數據構成有關。“衆所周知,一個産品用得人越多,往往就變得越來越好用,這是因為用戶的使用行為本身就是一種反饋機制,能夠幫産品自我改進。ChatGPT也是如此,在問題集中的領域,它有更多的樣本去學習、訓練、自糾;而偏門的知識領域,ChatGPT就缺乏足夠數據來深度學習,于是就會‘胡說一番’。”劉曉光表示,最近他使用ChatGPT的過程中,當詢問常見問題、新聞事件等,往往能獲得比較準确的答案,而一旦詢問相對偏門的知識,ChatGPT就開始明顯地“放飛自我”。
由此衍生的另一個話題,就是ChatGPT輸出答案的可靠性——它給出的結果是否正确,将由誰來判斷?如果無法判斷,也就無法進行正确的反饋。而衆所周知,正确的反饋對産品叠代十分重要。
另一方面,大量“胡說八道”式的垃圾内容被ChatGPT生産出來,似是而非、經不起二次校正的不可信内容廣泛出現,會削弱整個内容平台的公信力,讓人們對ChatGPT或同類産品的可靠性産生質疑。
畢竟,在當下這個充斥海量信息的社會中,相比于“信息密度”,人們往往更渴求的是“信息精度”。
“飯碗不保”?
人們該擔憂嗎?
ChatGPT橫空出世所引發的另一個争論,則相對更加嚴肅現實:會有人的工作崗位被ChatGPT取代嗎?
自有AI技術誕生以來,類似的話題就不絕于耳。但要回答這個問題,就要跳出對AI技術的盲目崇拜與“調戲”式的玩鬧心态,嚴肅地正視一個問題:ChatGPT目前究竟能幹什麼,或者即将能幹什麼?
對這個問題,ChatGPT自己給出了聊天機器人、自動文本生成、自動翻譯、情感分析、内容摘要、數據分析、虛拟助理等具體應用的場景。事實上,在這些領域中,ChatGPT已證明了自己比此前所有産品都要做得好,而且好得多。
劉曉光認為,長遠來看,技術進步帶來業态調整是必然結果。但一項新技術是否将帶來就業沖擊,以及具體将帶來何種沖擊,歸根結底還是要看技術落地的順利程度。
“目前來看,ChatGPT對圖片制作、文字生成、媒體内容生産、虛拟人服務、工作彙報、翻譯、編程、搜索引擎等領域會造成較大沖擊。就在2月7日,微軟已宣布推出有ChatGPT支持的最新版本人工智能搜索引擎必應(Bing)和Edge浏覽器,這已然極大地改變了搜索引擎的競争格局——毫無疑問地,從‘逐條抓取數據’到‘直接給用戶呈現答案’,這必然是更符合用戶需求的方向。可以看到,新技術的更叠如火如荼,有時人們說巨大變革就在眼前,并非誇大其詞。”劉曉光介紹道。
内嵌了ChatGPT的Bing搜索,直接制訂了提問者想要的訓練計劃
但劉曉光同時表示,正如前面所指出ChatGPT尚存在缺陷,其回答仍時常表現出不可靠性:“就拿ChatGPT所呈現的文字表達來說,要将它應用于實際場景,還離不開人的指導、檢查與驗證。”
從社會分工的角度來說,面對ChatGPT的沖擊,首當其沖的是重複性勞動較多的、不需要太多創造力的工作。而創造力,正是當前如何拼算力、燒财力,也無法讓AI輕易跨越的一道鴻溝。
“人為什麼會擁有創造力?迄今為止,這個問題連人類自己都無法說清,更遑論把創造力教給機器了。到目前為止,AI最擅長的仍然是‘照章辦事’,本質上還突破不了‘創造力’這一關,ChatGPT也不例外。”劉曉光說道,“如果哪天AI突破了創造力這一關,那麼人們要擔心的,也不僅僅是某幾個行業的就業崗位問題了——屆時整個人類社會都會面臨翻天覆地的變化。”
預訓練大模型
未來将走向何方?
早在2015年奧特曼、彼得·泰爾、裡德·霍夫曼和埃隆·馬斯克等一群科技領袖創立OpenAI時,OpenAI還是一家非營利企業。公司創始人們認為,要避免人工智能技術壟斷在少數巨頭手中,要通過開源促進技術開放。
但随着項目進展,訓練機器學習模型所需的資金越來越龐大,OpenAI開始成立一家營利性分支機構。2019年,風險投資人微軟入局。時至今日,微軟和OpenAI 之間的财務命運和技術變得越來越融合,今年1月份,随着ChatGPT的爆火,微軟又向OpenAI追加了100億美元的投資。
當前,ChatGPT仍處于免費試用狀态,但不斷有消息稱其将很快推出收費版本。同時,Bing搜索已内嵌ChatGPT,更有消息稱微軟或将把ChatGPT嵌入Office辦公軟件中,這不啻将是對辦公生态的又一次革新。
内嵌了ChatGPT的Bing搜索在寫詩
“預訓練大模型”類軟件将走向何方?在業内人士看來,雖然ChatGPT的核心理論已不算新鮮,但開發同類産品所需的資金和人力,某種程度上已構成了新的門檻。
“早在前一代GPT中,模型訓練一次的花費就高達千萬乃至上億美元,非常昂貴。OpenAI預計将在今年内發布GPT-4,那将是萬衆期待的進一步升級,同時也意味着它需要更多數據和更高計算力,這些都需要大量資金和人力。因此,開發同類産品的門檻在不斷變高。”劉曉光說道。
大勢之下,國内計算機業界有哪些機遇和挑戰?劉曉光認為,當前國内外公司在開發預訓練大模型産品的核心理論上,存在的差距并不算很大,但在數據采集、數據分析處理的能力上,“後來者”們仍有要追趕的距離。
“如果把機器賴以訓練、學習的數據比作食材,那這種食材就需要通過收集、處理變成适合吸收的樣子,這不是一項簡單的工作。無論文字還是圖片、視頻,它們一般都需要進行人工标注,這不是短時間投入大量資金就能立刻見效的事,而是需要很多人力和時間的積累。因此業内也有說法稱,數據才是互聯網企業最重要的資産,甚至有人将數據比作企業的‘護城河’。”劉曉光說道。
“預訓練大模型”類軟件未來将如何發展?劉曉光認為或許将指向三個特征:“一是數據量越來越大,計算力越來越強,包羅萬象;二是向專業化領域進軍,在某一細分領域把信息精度做向極緻,如醫療、法律、體育、編程等垂直分類;三是與具體應用場景深度結合,不僅僅停留在‘chat’,而是與虛拟人表演、電商營銷、售後客服、陪護老幼人群、文藝創作等場景相結合。ChatGPT所展現的潛力,預示着它有能力在這些領域大有作為。”
來源: 天津日報
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!