超級模型有哪些-tft每日頭條

超級模型有哪些

生活更新时间:2026-07-09 18:04:20

超級模型有哪些（大模型的未來在哪）1

文丨腦極體

自2018年谷歌發布BERT以來，預訓練大模型經過三年的發展,以強大的算法效果，席卷了NLP為代表的各大AI榜單與測試數據集。2020年OpenAI發布的NLP大模型GPT-3，實現了千億級數據參數。GPT-3除了具備傳統的NLP能力之外，還可以算術、編程、寫小說、寫論文摘要，一時之間成為科技圈中的爆點。到2021年，我們可以看到各大學術機構、科技企業都在打造自己的大模型，并且對其能力邊界、技術路徑進行了極大拓展。

身在科技圈中會有明顯的感受，今年大模型的會議與讨論越來越多，預訓練大模型本身的優勢我們在很多新聞中都感受到了。打造大模型并不是一件輕松容易的事情，需要耗費大量的數據、算力資源等，大模型的意義是為了讓算法模型集中化，但是市場中有條件的企業和機構都開始耗費大量資源自研大模型。大模型算法模型的集中化優勢，經過這些機構對集中資源的分化，又有種煙囪式的割裂。

其實現實可能隻需要一個發展到極緻化的大模型就足夠大家使用了，沒有必要人手一個。而且預訓練大模型的發展在這樣的模式下也會受到一些影響，而在這個态勢下也有一些趨勢與變化值得讨論與關注。
大模型發展模式的卡點

BERT、GPT 等大規模預訓練模型（PTM）近年來取得了巨大成功，成為AI領域的裡程碑。因為預訓練大模型的顯著優勢，現在AI社區的共識是采用它作為下遊任務的開始，而不是從頭開始訓練數據、建立模型。

随着産學研各界的深入研究，大模型在AI各界的地位得到不斷加強。一些機構和産業界對大模型的參與到角逐，使得其呈現出一種宣傳炫技般的畫面感受。這樣的發展模式很可能會給行業帶來一些不好的影響：

1.大模型成為一些機構和企業秀肌肉的軍備競賽，大家開始比拼各自參數集數量級。你百億級，我就千億級。數據集本身就有限，标榜自己的數據集越大，也意味着水分比較多，而在真實落地使用的情況方面，也并不不一定理想。算力資源和訓練時間消耗過大，并且也隻限于部分行業的部分問題，普适性差。

2.國内預訓練模型的玩家們可用的中文數據集有限，就是我們知道的幾種主流常用數據來源。在有限的數據集裡，大家使用的數據未免重複，而因此研究出來的大模型能力就比較接近。走相同的路徑做類似的事情，有點浪費資源與算力。

3.大模型是否優秀，不僅依賴數據的精度與網絡結構，也是對其與行業結合軟硬件協同能力的比拼。單純隻強調低頭研發高參數集、強算力模型等的方向，輕視一些與行業的協同二次調試等問題，就會陷入閉門造車的局面，限制了落地的路，走不遠。

4.一些預訓練大模型經過極緻化（數據、模型、算力）的發展後，也有可能面臨小衆、泛用性差的情形，比如一些高校研發的預訓練大模型隻能在小衆的學術圈子裡使用，無法工程化使用，最終淪為一次性的模型，浪費大量的資源。

雖然我們看到各種大模型在集中式爆發發展，但其實目前大模型行業還處于初始階段，面臨一些問題與卡點無可避免。行業内人士應該會更加敏感地體察到這些現象，誰也不會想要讓這些荊棘以常态的模式橫亘在發展前路上。大家花費精力激蕩腦力，想要發展的共識是打造出行業内唯一的模型。那麼，對于行業來說，究竟什麼樣的大模型才是最好的呢？
究竟什麼是好的大模型？

在這場battle裡，大模型向着規模極緻化的方向發展。那麼如何衡量大模型的能力，是一個繞不開的話題。衡量大模型能力的關鍵要素是，參數的規模和與細分行業結合對接的軟硬件協同能力。我們在各種新聞中經常可以看到，機構或者是企業用數據集或者是參數規模，以及跑分來彰顯自己的模型水平。

參數的規模決定了預訓練模型有多大。參數越大一般來說意味着大模型具備更多的能力，泛化性、通用性也更加強。成功的大模型背後，還需要大規模分布式訓練、并行計算、軟硬件協同優化等能力。

腦極體曾在GPT-3最火的時候，參與過一次試驗：用GPT-3寫個文章出來。我們給第三方提供了一些寫作的思路，想要看一下機器寫出來的效果怎麼樣（其實是想看看自己離失業還有多久）。結果得到的反饋是GPT-3在理解能力方面很牛很強，但是讓它去生産一篇稿件，對于它來說還是比較複雜而且困難的一件事情。

另外，排隊等待使用的企業過多，間次使用等待的時間過長，，并且稿件本身也需要好幾天才能完成。看似一個簡單的寫稿需求，對無所不能的GPT-3來說應該是小case，結果無疾而終。存在類似小需求的企業應該還是有很多，而這些需求都需要排隊等待調用大量的算力，并且磨幾天才能産出，而花時間花錢結果還存疑。當時行業裡最好的大模型落地都如此艱難，大模型的落地還是有點不理想。

好的大模型不僅僅需要模型、算力等本身性能方面強勁，關鍵也需要看與某垂直行業結合時産品化落地的能力是否實用。落地的大模型需要解決一些行業具體的問題，與行業結合時二次開發、對接的成本盡可能地小，否則它強勢的性能也隻是空中樓閣，中看不中用。大模型需要工程落地的能力，從而打開更多的邊界，讓更多領域和企業來使用。
大模型的未來趨勢

從産業價值的角度來看，預訓練大模型帶來了一系列可能性，讓産學研各界看到了由弱人工智能走向強人工智能，走向工業化、集成化智能化的路徑。在這樣的驅動背景下，大模型也會有一些可預見的趨勢與發展。

1.我們知道事物的發展規律是優勝劣汏，在競争的角逐中，一些标榜獨特性的小衆模型的泛化能力差，越獨特可能也就意味着越小衆，使用的範圍十分有限，可能會逐漸走向消亡。

2.崛起的大模型不僅僅是泛化性、落地能力強，創新性強、訓練數據規模大，也需要具備不斷生長革新的能力，也就是自我進化、智能化的能力。大模型的未來需要創新，也需要自我生長，向可持續、可進化的方向發展，架構上的革新會讓模型更加高效。

3.大模型能力的端側化，“芯片化”。将模型的一些運算存儲等能力像芯片一樣固化在一些端側硬件設備中，在使用的過程中不用在重裝的模型中耗時調用算力與數據，可以實現随時調用随時使用。現下的模型多是重裝大模型，使用的話需要調用龐大的算力和運行時間，未來的大模型會逐漸改變這種模式。

4.大模型的标準化與模塊化發展。大模型的評估未來會有标準化成熟的體系來衡量，這個體系也會是行業内公認的标準，用這個标準來衡量大模型的優劣而不是現下自賣自誇式的标榜。

目前我們在各大榜單上看到的分數來自于大型的數據集和算力模型，讓開發更加容易，調試與訓練的周期越來越短。但我們也知道大量的數據喂養出來的模型回報并不是百分百地正确。喂養的數據知識的極大擴展也無法保證結果的确定性，這也是大模型最大的弱點，而這也意味着對于大模型的探索需要持續的叠代發展。

預訓練大模型是面向通用智能最高階的探索，也是AI持續變革的核心發展方向與動力，随着AI不斷深入産業與各學科領域的過程中，大模型在軍備battle和百家争鳴，算力、數據、規模都會朝着極緻化的方向發展。未來新的預訓練大模型将會與那些計算量巨大的科學領域，比如制藥、腦科學、醫療、生物計算等領域相互結合，帶來巨大的價值。

我們的那些懸而未解的難題，在未來都會有答案，無論最終這個結論正确與否，都能夠為前沿的發展、探索帶來很多靈感與角度，世界的多面體将會被打開。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活如何快速在冬季來臨前預防凍瘡
央廣網北京12月23日消息據中央廣播電視總台中國之聲《新聞超鍊接》報道，冬至已過，數九寒天開啟，天氣越來越冷。除了打哆嗦，凍瘡也會在我們的耳朵、手上悄悄蔓延。長了凍瘡的手指會化身“蘿蔔手”，變得又紅又腫，甚至出現水疱、潰瘍，痛癢難耐。最麻煩... 2022-12-11
生活水龍頭容易壞掉嗎
水龍頭給我們的生活帶來很多的方便,在衛生間或廚房,它已經成為家庭生活中不可或缺的一份子。由于使用頻率高，所以時間一長水龍頭出現滴水、開關關不嚴等現象，今天我就告訴大家如何安裝衛生間水龍頭，簡單易學！1、首先準備好工具,安裝前檢查配套零件是否... 2022-12-19
生活蘋果s3日常使用怎麼樣
一、前言去年12月的時候我買了一台蘋果新上市的M1MacbookAir筆記本，當初是考慮到家裡有主力PC，買筆記本為了外出旅遊時也可以剪視頻、處理圖片。後來在使用過程中發現蘋果M1剪視頻的體驗非常棒，就把我的PC機淘汰了，一直拿這台M1筆記... 2023-02-06
生活霍元甲死亡之謎探秘時刻
一部名為《霍元甲》的電影于2006年上映，在全國各大影院都出現座無虛席的情況，這部功夫電影，是由李連傑領銜主演的，再一次掀起了新的功夫熱潮，也讓萬千中國人為一代大俠霍元甲的匆匆離世，而感到惋惜！霍元甲，于1868年，出生在天津市靜海縣小南河... 2022-12-06
生活五種人不宜喝三七粉
導語：在最近幾年來，三七粉在養生圈當中是越來越流行了，很多比較愛養生的人，他們都對三七粉特别的熟悉，甚至很多人都認為喝三七粉可以達到包治百病的效果，即便是身體沒有任何的問題，在吃完三七粉之後也可以預防各種各樣的疾病出現。三七粉其實是一味中藥... 2022-11-16
生活省局屬地管理
省局屬地管理?按照《醫療器械監督管理條例》規定，根據企業申請，現注銷鄭州市中原福力工貿有限公司以下3個産品的醫療器械注冊證書，我來為大家講解一下關于省局屬地管理?跟着小編一起來看一看吧!省局屬地管理河南省藥品監督管理局關于注銷醫療器械産品注... 2023-02-03
生活 ps圖層文字尾部對齊
大家好，今天跟大家分享在使用PS軟件時如何讓圖層中的文字在畫布中居中對齊。下圖文檔中有兩個圖層，下面一層是背景圖層，上面一層是文字圖層。當前文字圖層中的4個字“清明雨上”位于畫布的左上位置，接下來我們想讓文字在畫布中水平和垂直方向上均居中對... 2022-12-25
生活 36條過江通道
近日，南京市舉行“十四五”重點專項規劃系列專題新聞發布會（第三場），《南京市“十四五”綜合交通運輸體系發展規劃》正式發布。江北新區将在未來五年，全面形成“四通八達”的交通密網。過江通道目前已有的過江通道有10條，分别是南京長江四橋、南京長江... 2023-02-02
生活李宗盛前妻的孩子
李宗盛前妻的孩子?7月24日，知名歌手李宗盛的第一任妻子朱衛茵複出開始主持新節目節目中前夫李宗盛和兩個女兒也錄制了祝福視頻，十分有愛，我來為大家講解一下關于李宗盛前妻的孩子?跟着小編一起來看一看吧!李宗盛前妻的孩子7月24日，知名歌手李宗盛... 2022-10-17
生活最後鳴人當上火影了嗎
木葉村曾經有兩大家族，分别是宇智波一族與千手一族，随着千手一族族人的沒落，位置漸漸被日向一族頂替。兩個家族都是以血繼限界聞名忍界，不過這兩個家族雖然曾經巅峰過，但是都因為一些緣故逐漸沒落。宇智波一族是因為他們的野心，而且一開始就被二代火影所... 2022-11-30
生活深蹲的标準動作是怎樣的
深蹲的标準動作是怎樣的?雙腳與肩同寬，或略比肩寬背部（脊椎）維持正直，不要拱起或過度凹陷，接下來我們就來聊聊關于深蹲的标準動作是怎樣的?以下内容大家不妨參考一二希望能幫到您!深蹲的标準動作是怎樣的雙腳與肩同寬，或略比肩寬。背部（脊椎）維持正... 2022-06-03
生活 30條歇後語短的
#頭号周刊#更多精彩，請您點擊右上方關注，每天更新。溫馨提示：點擊文章頂部帶有耳機圖标可以進行播放文章喔[聽歌]今天我們繼續一起分享中國傳統文化趣味生活小知識——歇後語，這些歇後語大部分是古時勞動人民們在日常生活中總結出來的，其中有一部分出... 2023-02-02
生活山居秋暝桃花溪
雨說停就停了，村莊被沖洗得清清爽爽。袅袅娜娜的炊煙似山間某間寺院敲響的晚鐘，在秋天微涼的空氣中緩緩遊動。偶一台頭，月亮不知什麼時候挂上了樹枝？晶瑩的光輝，在松針的鋒芒下，碎的滿地都是。一些清脆的聲音潺潺的淌過石頭，然後又隐隐約約的流向遠方。... 2022-11-29
生活怎樣考雅思6.5分
把英文學到雅思6分級别真可謂是一種成就。通常來說，在輸入方面，6分級别意味着學生可以大概聽懂和看懂英文母語級别的内容。即使還是會有許多不懂的地方，隻要對所看的内容有感興趣，6分級别的學生真的可以享受用母語者會看和聽的東西來學習。而對于輸出能... 2023-02-04
生活墨西哥玉米草怎麼種植産量最高
有很多朋友會有疑問，墨西哥玉米草的産量到底有多少，真的會有30~40噸嗎，認為小編是在誇大其詞，但是我在這裡跟大家說明一下，墨西哥玉米草的産量确實是有這麼多，不過前提是要種植環境适宜、土壤肥沃、水肥充足的情況下，也就是一高水肥的條件下并且種... 2022-12-21
生活初三語文名著閱讀的思維導圖
七年級上下冊1.《朝花夕拾》2.《西遊記》3.《海底兩萬裡》4.《駱駝祥子》八年級上下冊5.《紅星照耀中國》6.《昆蟲記》7.《傅雷家書》8.《鋼鐵是怎樣煉成的》9.《水浒傳》10.《艾青詩選》11.《簡愛》12.《儒林外史》, 2023-01-01
生活哪些茶葉要放冰箱保存
喝茶，是我們中國人的傳統習慣，基本家家戶戶都會喝茶，因此人們家裡都會備上些茶葉，以便待客。但如果買多了茶葉儲存不好的話，品質就會受損，甚至變質發黴，泡出來的茶湯香氣和味道也會改變，這樣的茶是萬萬不能再喝的。很多人會把買來的茶葉直接放在冰箱裡... 2023-02-09
生活為什麼初學鋼琴容易折指
琴童在學琴時，如果沒有養成良好的手型，很容易出現折指情況。有時手指的第一關節是塌陷的，也有的同學五個手指都有折指現象。遇到這種情況一定家長老師一定要及時的糾正!1、勤剪指甲指甲要勤剪，而且要剪得狠，不留一點白邊。如果指甲長得靠前，即使都剪到... 2023-02-15
生活燒烤蔬菜最正宗的做法
基本能吃的素菜都能做燒烤，茄子、辣椒、菜椒、長豆角、香菇、平菇、土豆片、紅薯片、藕片、香蕉、青蘿蔔、芹菜等。如果要評選出中國最受歡迎的街頭美食的話，那非燒烤莫屬了，盡管有些時候街頭上的燒烤都不太衛生，但是仍然阻止不了中國吃貨對它的喜愛，燒烤... 2022-10-24
生活杭州3歲女孩被燒
來源：甯波晚報油焖筍、糖醋黃魚、紅燒柴魚、清蒸玉秃魚、大蒜炒羊肉、紅燒八爪魚、鹽水辣螺、三鮮湯……桌上一共28個菜其中20道竟是一個小學六年級學生烹制的媽媽把他燒的菜發朋友圈後引來贊聲一片這個男孩就是甯波市象山縣石浦鎮新港小學六年級學生，叫... 2023-01-09
生活塔樓和闆房的區别
塔樓和闆房的區别?性質不同塔樓一般是指高層建築，樓房的高度從12層以上到35層，超過35層是超高層闆樓是對建築結構的構築物的稱呼，闆樓一般建築層數不會超過12層，我來為大家科普一下關于塔樓和闆房的區别?以下内容希望對你有幫助!塔樓和闆房的區... 2022-06-23
生活省考公務員申論有幾題
省考公務員申論有幾題?歸納概括題(歸納概括題多以概括、歸納特定資料内容的形式出現，字數、分值和難度都較低，多為試卷的第一題)，下面我們就來說一說關于省考公務員申論有幾題?我們一起去了解并探讨一下這個問題吧!省考公務員申論有幾題歸納概括題(歸... 2022-07-12
生活自考是不是隻能考二本學校
自考是不是隻能考二本學校?答：自考一、二、三類考生解釋如下，接下來我們就來聊聊關于自考是不是隻能考二本學校?以下内容大家不妨參考一二希望能幫到您!自考是不是隻能考二本學校答：自考一、二、三類考生解釋如下一類考生：是指考生參加自考，報考的專科... 2022-10-29
生活養一隻寵物龜的感受
人們總是對萌萌的小可愛無法抗拒，無論這個小可愛是什麼。比如卡哇伊的毛絨玩具，或者剛出生的哪種動物也是一臉萌萌，亦或者是可愛靈動的小孩，都是忍不住上前抱抱。畢竟這樣的外貌更能打動你的内心。當然，對于龜來說，相信不少龜友入坑就是被它的一臉萌萌給... 2023-03-11
生活為什麼比熊喜歡讓人抱
比熊是一種小型犬，很多寵主都喜歡抱着比熊，但你知道嗎，其實抱比熊是有講究的。今天就來說一下比熊最讨厭的5種抱法，怪不得它不給你抱，原來會傷害它！一、扛在肩膀上有些寵主特别标新立異，喜歡用特别的方式來報比熊，比如把比熊扛在肩膀上。這種抱法其實... 2023-02-02
生活春天的畫簡單又漂亮
文/茗馨桃花朵朵嬌玲珑，瓣瓣柔勻吐芳紅。含笑生姿顧盼生，薄唇一瞥隕落情！圖片源于網絡, 2023-02-06
生活酸豆角怎麼做
酸豆角怎麼做?首先要一個泡菜壇子或者是能密封的玻璃器皿，洗幹淨，保證無油幹燥，現在小編就來說說關于酸豆角怎麼做?下面内容希望能幫助到你，我們來一起看看吧!酸豆角怎麼做首先要一個泡菜壇子或者是能密封的玻璃器皿，洗幹淨，保證無油幹燥。新鮮的豆角... 2022-06-06
生活為什麼黃種人分布範圍很小
黃種人5萬年前，K（M9）這個超級男性祖先的後代中，産生了單倍群L、M、K、P這四大白人超級祖先，這四個白人男性的後代成為現代白人血統的重要構成部分。K這個超級祖先的其他後代中，3.5萬年前，出現了NO（M214）的這個超級男性祖先，其直系... 2022-10-29
生活國足菲律賓預測首發
直播吧5月26日訊據《北京青年報》報道，原定于31日從迪拜飛往上海的菲律賓隊更改了行程，他們将晚一天由多哈乘坐航班抵達上海。作為本次40強賽重啟後國足交手的首個對手，關島隊已經于5月23日深夜從上海入境，目前關島隊已經進駐蘇州賽區并展開了備... 2022-12-26
生活益母草泡腳的作用與功效
導語：益母草的“母親”，酷似五指毛桃，曬幹泡腳好處多，你是否了解？農村是野草的天下，各種各樣的野草應有盡有，有些野草甚至長得特别相似。就好像我們人類一樣，同一個家族的成員長相都會有些相似。野草也是一樣，對于同屬同科的植物，它們也都是“親戚”... 2022-11-19

tft每日頭條

> 生活

> 超級模型有哪些

超級模型有哪些

大模型發展模式的卡點

究竟什麼是好的大模型？

大模型的未來趨勢

相关生活资讯推荐

热门生活资讯推荐

网友关注