tft每日頭條

 > 生活

 > 人工智能ai模型系統

人工智能ai模型系統

生活 更新时间:2024-07-20 23:16:32

人工智能ai模型系統(開源大模型的力量)1

智東西(公衆号:zhidxcom)

作者 | 楊暢

編輯 | 漠影

你有想過和AI(人工智能)玩劇本殺嗎,會是一種什麼樣的體驗?

最近,一群腦洞大開的開發者們基于浪潮 源1.0大模型,開發出了一個能和人玩劇本殺的AI(以下簡稱:劇本殺AI)。這個AI不但可以從容回答你提出的各種相關問題,還能向你抛出反問。在遊戲劇情解謎過程中,其餘真人玩家可能察覺不出來他們是和AI在玩遊戲。

浪潮 源1.0大模型是2021年9月浪潮發布的全球最大巨量模型(或稱單體模型)之一。源1.0大模型的模型參數規模達2457億,其中文訓練數據集多達5TB,在2128個GPU上運行了16天就完成了其參數的訓練。參數規模、數據集、算力效率均超過業界知名的大模型GPT-3。

人工智能ai模型系統(開源大模型的力量)2

其實随着浪潮 源1.0等各類大模型的陸續發布和開源,這些算法基礎設施為各行業開發者實現其創意構想提供了強大的支撐,也為AI産業的發展和其他産業的數字化轉型提供了助力。

同時,大模型的出現為強人工智能的實現提供了更多的可能。強人工智能即具備和人類一樣甚至超過人類的AI一直是AI領域的研究目标之一。目前的AI已經能完成一些需要創造力的任務,如作詩、寫歌、畫畫等。人們期待着AI能夠理解人的情感或者博弈,所以不斷有開發者嘗試像劇本殺AI類似的創造性AI項目的開發。

那麼這樣一個能與人互相博弈的AI是如何開發出來的?為什麼其開發者說浪潮 源1.0大模型給項目開發和創意實現帶來了颠覆性變化?元宇宙的智能核心竟然是大模型?智東西與浪潮人工智能研究院首席研究員吳韶華、劇本殺AI開發者、VR/AR資深從業者無空(工作昵稱)進行了深入交流,發現想要實現真正的強人工智能存在多重困難,讓AI擁有類人的情感和思考更是充滿巨大的挑戰,不過浪潮等AI前沿技術探索者們一直在這方面進行不斷的探索和嘗試。

一、隻有一位有代碼經驗,5人團如何開發出劇本殺AI?

無空談道,他一直關注AI驅動内容生成相關的産業進展,留意到2021年以來不少國内科技企業紛紛發布了其開發的大模型,其中就有像浪潮 源1.0這種針對中文自然語言處理的大模型。

他說,看到浪潮 源1.0大模型開源的消息後,他就去申請了浪潮 源1.0大模型的API,想體驗浪潮開源出來的這個大模型。2022年1月份,API申請通過,拿到浪潮 源1.0大模型的API後,無空就嘗試了一個簡單的demo試驗。

在他看來利用大模型生成的模拟對話都是符合正常人表達邏輯的,這讓他很震驚,因為這強于之前所見的大多數模型。體驗到浪潮 源1.0大模型在目的性對話生成方面具備的突出性能後,無空想到劇本殺可能是更好的一個利用大模型的思路。然後,他和與他有相同興趣的四名高校學生一起組成了一個團隊,開始嘗試用源1.0大模型來實現他們設想的能與人一起玩劇本殺的AI。

劇本殺AI團隊選定了一個線上微型劇本殺遊戲劇本。這個劇本需要五位玩家共同參與,遊戲過程在微信上進行。劇本殺AI團隊設定其中的四個角色由真人玩家扮演,剩下的一個角色由AI扮演,本着細節拉滿的原則,開發者為AI也準備了一個微信賬号,并設好了昵稱、頭像和近三天的朋友圈内容。

人工智能ai模型系統(開源大模型的力量)3

這個劇本殺的劇情設置是:經過科技公司巨頭“北極鵝”腦機接口改造的AI人蔡曉(劇本殺AI)已經加入到某高校的推理社團,計劃推動社團的其餘人同意和科技公司巨頭“北極鵝”合作,控制推理社,從而幫助“北極鵝”擴大其腦機接口試驗範圍。

其餘真人玩家也有各自有要達成的目标。通過文字交流,各角色之間進行博弈。

人工智能ai模型系統(開源大模型的力量)4

如何實現讓AI能像真人一樣參與到劇本殺遊戲中?

浪潮 源1.0大模型是一種生成式預訓練模型(GPT),其使用的模型結構是Language Model(LM),擅長零樣本和小樣本學習。

劇本殺AI開發團隊最終采取的方案是建立example語料庫,然後針對每次的提問内容,從example語料庫中選取三個最符合的example作為模型生成的小樣本輸入。

因為AI需要根據劇情對不同角色要采取不同的回答策略,所以語料庫被分裝為4個TXT文件,AI會根據提問者選擇對應的語料來源,然後生成其回複内容。

除了無空之外,其餘四位劇本殺AI團隊成員并沒有代碼經驗,他們主要負責的就是語料庫的完善,不斷根據公測結果對AI回答的比較差的問題進行相關語料的補充。

無空說,他們團隊在開發劇本殺AI後,已經進行了三輪公測,主要收到了三類反饋。

第一類反饋是有些出乎劇本殺AI團隊意料之外的,無空談道其實他們是不想讓人類玩家意識到是有一位AI玩家的,從實際的玩家反饋來看,不少人的第一反應是沒發現其中一位玩家是AI,他們更關注遊戲劇情進展。而當玩家得知是和AI一起玩劇本殺,他們也樂意去和AI進行更多的交流。

第二類反饋是目前版本的劇本殺AI還存在一些限制,比如需要有4個真人玩家才能開始劇本殺遊戲測試;單純的文字交流影響遊戲體驗,因為線上文字劇本殺不如線下劇本殺還能觀察其他玩家的肢體、面部表情等語言之外輔助推理的細節。

第三類是玩家感覺AI的回複效果還有很大提升空間,AI生成的回複有很大的不确定性。

在體驗過浪潮 源1.0大模型在助力開發方面的能力後,劇本殺AI團隊還提煉出了一套端到端的對話生成機制方案,該方案比傳統的對話生成模式更靈活,開發周期更短,效果更好。他們還嘗試将這種方案應用在社區基層工作效率提升方面,幫助社區志願者解決難以短時間内将同樣的公告内容發到幾十個微信群中的困難。

無空講到未來他們會基于浪潮 源1.0的升級疊代,将其劇本殺AI進行進一步的優化和疊代,開發出更成熟的作品,讓更多人可以體驗劇本殺AI。同時,他們還會進一步研究其提煉出的端到端的對話能力如何更好地在治理、服務等領域實現應用和賦能。

他總結說,大模型對于相關AI應用開發來說,帶來的變化是颠覆性的,不僅僅是開發時間和開發流程上的優化。未來,或許有開發者可以通過大模型為元宇宙中的虛拟數字人注入“靈魂”,讓虛拟人能更自然和靈活地與人交流。

同時,大模型運算對于數據和算力有較高的要求,對于想使用大模型的開發者來說這可能是其面臨的主要難題之一。不同大模型的開源程度不同,無空說,浪潮 源1.0以API的形式為開發者提供開源服務,降低了開發者的使用門檻,讓開發者可以将其精力更多的投入到創意構思方面。

二、4個技能模型助力大模型落地,API模式實現深度開源

2020年時OpenAI推出GPT-3,引發了AI行業對于大模型的各種思考。

浪潮人工智能研究院首席研究員吳韶華談道,浪潮當時選擇進行大模型的研究主要有兩方面的考量。一是浪潮當時就看到了GPT-3這類大模型在小樣本、零樣本情況下的學習能力,以及基于此的自然語言處理能力;還有就是大模型能夠同時支撐多個不同任務的能力。浪潮認為大模型會對AI算法研發産生非常深刻的影響,也代表着一種新的趨勢。

二是,吳韶華補充說,能開發大模型也是依托浪潮在大規模算力算法上面有多年的持續積累,并且有相關的基礎。基于這些考量,浪潮研發并推出了源1.0大模型。

源1.0大模型專注于NLP(自然語言處理)領域,能夠創建生成任何具有語言結構的語言表達,能夠做到包括自動問答、論文撰寫、詩歌寫作、新聞報道、總結長文本、翻譯語言等任務,甚至還可以“寫”計算機代碼。

人工智能ai模型系統(開源大模型的力量)5

更重要的一點是源1.0大模型還可以理解文字背後的含義,并抽取其中的關鍵信息,如應用于智能客服對話時感知用戶情緒,更智能地給出回應。

在發布後不久,2021年10月,浪潮開源了源1.0,并發布“源1.0”開源開放計劃,在GitHub等開源社區開源了其大模型的模型訓練代碼、推理代碼、應用代碼,開放API等,助力開發者更高效地實現AI應用的開發。

浪潮不僅開放了相關的代碼以及大模型使用的API,同時還開放出了1TB的語料數據集,這些語料數據集是來自當初浪潮訓練大模型的基礎數據集。

吳韶華提到浪潮開源 源1.0大模型從四個方面為開發者提供支撐或說提升開發者創意實現的效率。

一是浪潮開源了直接可用的代碼示例,可以幫助開發者節省各類研發開支。

二是浪潮 源1.0大模型的開源模式之一是向開發者提供大模型API,顯著降低了開發者應用開發的門檻。

不同知識背景的各行業用戶可以驅動大模型創造更多的可能,就像劇本殺AI一樣。用戶可以完全通過模型的能力和開發的API就能創造各種不同的任務,實現不同内容的交互,将部分繁瑣的開發流程省略。

浪潮在降低開發門檻上面還進行了兩類探索,一個是APIExp的工具,讓用戶直接通過網頁與大模型交流,一個是研發了一款沙箱工具,同樣是通過網頁直接選擇用戶所需的創意效果。

三是浪潮将源1.0大模型相關的訓練數據開源,能助力用戶實現業務模型或代碼優化。吳韶華舉例說,有開發者直接利用浪潮開源的數據集來對其模型進行二次訓練,得到了明顯的精度提升,訓練結果甚至登頂CLUE基準評測榜單。

四是浪潮會給到利用源1.0大模型的開發者一些持續的支撐,進而實現開源社區交流共赢。浪潮為開發者提供持續的支持,有專門的運營團隊與開發者建立聯系,建立社區,增進彼此之間的交流,更及時地了解開發者在技術和使用方式上的問題。

同時浪潮也會第一時間給出相關問題的反饋。一些深入的技術問題,浪潮會投入專門的研發團隊進行進一步的研究和支持,交流的成果還會以代碼的方式進行開源。

吳韶華談道,因為源1.0大模型的應用場景多元,浪潮目前基于大模型推出了4個面向不同場景的技能模型。這四個模型都經過了場景化數據的增強,表現精度更好,所需算力相對更小一些。

人工智能ai模型系統(開源大模型的力量)6

第一個是古文模型,可以“寫”詩詞歌賦,同時具備古文解析能力。第二個技能模型是對話模型,主要面向虛拟人、智能助手場景。第三個是翻譯技能模型,中英文翻譯準确度和流暢度上均有不錯表現。第四個技能模型是問答模型,主要是面向智能客服場景,該模型具備語義級知識檢索能力,可以做到多領域支持。

三、大模型或成元宇宙智能核心,源2.0瞄準多模态交互

當了解完劇本殺AI和源1.0大模型後,我們還能看到,其實這個劇本殺AI開發項目也引發了一些人對于大模型與元宇宙之間關系更多的思考。

其實,源1.0大模型以及基于大模型的四個技能模型,都是專注于自然語言理解的,可幫助人機交互場景的實現,可應用于虛拟人、元宇宙領域。

劇本殺AI開發者提到他感覺在未來的元宇宙中,虛拟人的數量将數倍于真人,這樣才能帶來比現實更好的體驗。然而目前的虛拟人外表都很好看,但是都是“提線木偶”,更多地依賴于開發者的設定,而他們希望為虛拟人注入“靈魂”,讓它能更靈活自然地與人交互。這也是他們進行劇本殺AI開發的另一層考慮。

吳韶華說,關于大模型和元宇宙這兩個智能行業的熱門方向,他認為在元宇宙中大模型會成為其智能的核心,主要有兩方面原因,一是大模型的泛化能力,可以支撐多任務;二是大模型體現了更高的智能化水平,在人機交互中,會給人更真實地感受。

浪潮一直在持續優化源1.0大模型,未來可能面向更多場景,基于開發者的需求,推出更多的類似技能模型的新模型。

吳韶華還透露,浪潮目前也在規劃源2.0大模型的開發工作。源2.0大模型會瞄準多模态交互進行相關的研發布局。

結語:開源大模型泛化應用有望助力産業轉型

劇本殺AI的開發一方面體現了業界對于強人工智能、人機交互的更多探索,另一方面也為我們展示了開源大模型在其他行業智能應用開發方面的能力。

除了劇本殺AI之外,詩詞寫作、智能客服、個人智能助手等等基于浪潮 源1.0大模型開發的各種應用也陸續進入大衆的視野。未來在智能客服、虛拟數字人等方面,基于大模型的開發存在更多泛化的應用場景。

人工智能ai模型系統(開源大模型的力量)7

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved