集成建模技術-tft每日頭條

集成建模技術

生活更新时间:2026-07-21 12:52:38

來源：環球網

近日，“昇騰萬裡共赢智能新時代”峰會在深圳成功舉辦。峰會集聚了人工智能産業界權威專家、學者和商業領袖，共商人工智能産業發展趨勢，共同推動人工智能産業繁榮發展。

大會現場，中國工程院院士、鵬城實驗主任、北京大學教授高文發布《鵬城雲腦支撐鵬程系列大模型基礎研究》主題演講，如下是高文院士演講全文要點。

各位專家、各位來賓，大家好！今天我主要是講鵬程大模型和自然語言處理有關的賦能。

鵬城實驗室是國家為了中國科技長期能夠穩定支撐整個國家的發展，所布局的戰略科技力量當中的一支團隊，主要聚焦寬帶通信和新型網絡方面，包括高效能雲計算服務。今天我講的基于昇騰基礎軟硬件所做的工作就是屬于高效能雲計算服務中的一塊，主要是通過鵬城雲腦來實施這個戰略。

為什麼要做這個？道理其實大家很容易懂，現在有了人工智能，因為數據增長速度非常快，算力又滿足不了要求，應用又很急切，我們怎樣把這些東西全都打通？需要有一個非常強的算力平台作為支撐，能夠處理大規模的數據，能夠有好的算法，在這個算力平台上把想要的解決方案提供出來，所以有這樣一台大的設施是非常關鍵的，這個設施我們就把它叫做雲腦。

集成建模技術（鵬城雲腦支撐鵬程系列大模型基礎研究）1

我們在建設鵬城雲腦II的期間，真正實現了“深圳速度”的一個神話，為什麼呢？了解我們國家科研制度的都知道，你要想做一個大的裝置，或者做一台比如說大的機器，從開始到論證、報方案、批複，然後科研，然後再開始建設，這一個周期下來，快的是幾年，慢的有的是十幾年。而鵬城雲腦II從開始遞交方案到機器建成一共用了九個月，真正體現了“深圳速度”。編制項目建議書是在去年（2020年）3月份，雲腦II機器啟動運行是在去年10月15号，大家看左面這個坑是建機房之前，原來是采石場的一個坑，右邊這個照片是機房建好以後的樣子。現在這台機器非常忙，這個機器的機時的使用率是99%，就是基本上是一點都不閑着，排着隊在等機時，因為我們有太多大模型需要在這個機器上去訓練。

集成建模技術（鵬城雲腦支撐鵬程系列大模型基礎研究）2

這個機器我們叫E級AI算力，達到1000P，所謂E級是10的18次方，或者換成我們普通說法叫做百億億次，我們知道一億是10的8次方，億億就是10的16次方，後面再加兩個零就是百億億次，應該說在AI算力上，是現在最強的一個，當然可能其他一些地方也有比這個算力規模稍微小一點的機器，現在用華為的系統已經建了大概六七個、七八個，或者是100P、300P的機器，大概是這台機器的1/10，或者是1/3這樣的一個算力。這個算力要把它轉起來還是要花點氣力的，因為我們這台機器是基于華為的Atlas 900 AI集群實現的，一組Atlas 900 AI集群有128個計算節點，每個節點内包含8顆昇騰910處理器，我們把四組Atlas 900 AI集群連到一起，整個是統一接口、統一形象，完全是一張網、一個機器。為了做這個機器，我們把四組集群上面架了一個全交換的非常快的網絡，為了讓它對數據的讀取速度更快，對每一個機器裡面的存儲做了加強，對它内部的一些運算底層的軟件做了優化，這樣就使得這個機器的速度非常快。快到什麼程度呢？基本上這台機器現在在全世界的IO速度是最快的。快到什麼程度呢？在去年的11月份，這台機器去打榜的時候，比排第二的英特爾的一台機器快了四倍。如果想做人工智能訓練，想做大模型訓練， IO的速度是決勝的，因為要有大量的數據來回的讀進去吐出來，如果IO速度如果不行的話，很多的開銷都被IO給吃掉了。這台機器因為它IO方面做了特殊的配置，而且網絡方面也做了特殊配置，所以這個速度，就是通信的開銷，整個占比是比較低的，所以它在整個模型訓練的時候效率就會高。

集成建模技術（鵬城雲腦支撐鵬程系列大模型基礎研究）3

這台機器現在至少已經訓練出兩個千億級的大模型。前幾天華為已經發布過一個盤古大模型，今天我要跟大家說的是叫鵬程大模型，這是兩個自然語言處理預訓練大模型之一。大家知道GPT3基本上是做自然語言處理，大家非常向往的一個模型，微軟為了訓練一個GPT3在微軟的環境下，花了1200萬美元訓練出一個GPT3的模型來。我們現在雲腦II機器做完以後，已經訓練出兩個這樣的模型，一個是鵬城實驗室跟MindSpore團隊等聯合攻關訓練出來的，這個模型叫鵬程.盤古，模型參數為兩千億；另一個是華為雲聯合鵬城實驗室一起聯合訓練出來的大模型，這個模型叫華為.盤古，這個模型參數為一千一百億。這兩個模型整個的複雜度都是千億參數，而且專門是針對中文的最大的模型。

鵬程模型還有一個特點是開源的，我們内部的人讨論說，就算你把兩千億開源了，它離了我們這台機器還是玩不轉，要想跑起來就得來我們這個機器上跑。為了支持應用怎麼辦呢？我們先開出一個百億級的大模型來，那麼千億級的，如果有需要，隻要是講清楚你要怎麼用，在哪裡算，我們也可以開。所以原則上支持開源的。

那麼有了這個開源，你就可以做很多自然語言處理方面的事。你要想做一個中文的問題回答系統，就是問答系統，你要想做自然語言的理解，想做一些理解器，或者你想做機器翻譯等等，這個系統都可以做。這個模型可以做雲搜索、智能客服、醫療的一些向導、互動的教育、文學創造、自動摘要的生成，甚至做代碼的生成。現在我們有一個團隊在做一個知識産權交易聯邦推薦系統，沒有這個模型之前，是用軟件和很多專家的知識，做了一個系統，用上鵬程大模型以後，這個系統性能一下子提高了12.2%，所以鵬程大模型的好處是顯而易見的。而且我們希望用這個模型來突破“語言壁壘”，支撐“一帶一路”的國家戰略，也就是說用這個模型我們很容易做機器翻譯，做商業的這種報關等等這些文件的交換。以前是商量好用英語或者商量好用什麼語言，現在随便，你這邊用中文，那邊用阿拉伯語，通過這個東西馬上給你互譯過來。大家現在用手機就可以登錄進去，試試這個模型好不好用，你問一些問題，看看它能不能回答出來。

集成建模技術（鵬城雲腦支撐鵬程系列大模型基礎研究）4

鵬程大模型到底是怎麼“煉”出來的呢？它是有四個方面基本的要素：

第一個要素是AI的算力，就是鵬城雲腦II；第二個要素是要有高質量的中文語料庫，我們有一個專門整理中文語料數據集的團隊，把能拿到、能買到的數據全都拿來進行清洗，然後把數據整理得非常好，送進機器就可以進行訓練；然後要有一個非常好的全自動并行的這樣一個算法，這個算法是由昇騰、MindSpore團隊和鵬城實驗室的工程師無縫合作，把這些全并行的技術實現了；最後就是通過“産學研”三方合作新型研發合作機制，結合華為的産業優勢，北京大學的學術優勢，以及鵬城實驗室的研究優勢，形成互補、協同。

集成建模技術（鵬城雲腦支撐鵬程系列大模型基礎研究）5

整個鵬城雲腦可以作為核心節點連接全國算力的基礎設施，我們剛才說的是1000P的這樣一台機器，現在全國各地有不少基于昇騰軟硬件在做的100P的或者300P的機器，這些可以聯動起來一起做，有大的問題、難的問題可以到1000P的機器上跑，小一點的模型或者私有化的一些應用，可以到100P、300P的機器上跑，這樣大家有些分工，就可以在全國把人工智能分享起來。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活怎麼防止快遞被放菜鳥
1、首先，我們打開手機淘寶，打開我的淘寶頁面後，點擊菜鳥驿站。2、打開菜鳥驿站後，彈出服務授權協議，... 2023-07-07
生活用掃帚打人會犯什麼忌諱
1、會不利于對方的綜合運勢：用掃帚打人會犯什麼忌諱？不利于對方的綜合運勢是個非常主要的方面。根本上會... 2023-07-07
生活注冊管理公司流程
1、核名：到工商局去領取一張“企業(字号)名稱預先核準申請表”，填寫你準備取的公司名稱，由工商局上網... 2023-07-07
生活 PPT無法導入word大綱
PPT無法導入word大綱怎麼辦：1、打開Word文檔，點擊【視圖】—【大綱視圖】，将文檔切換為【大... 2023-07-07
生活花盆反堿處理妙招
1、花盆返堿說明土壤結構也不太好了，換盆換土是解決返堿現象最直接、改善效果最顯著的方法。現在3月份了... 2023-07-07
生活對方微信隐私設置了怎麼加
1、首先：打開微信app，這裡有用名片添加好友受限制為例，點擊“名片”2、點擊“添加到通訊錄”。3、... 2023-07-07
生活漏電保護器c型和d型的區别
1、C、D型結構上的區别就是：電磁脫扣器不一樣，電磁脫扣器不一樣，電磁脫扣器不一樣。2、用作電動機啟... 2023-07-07
生活去除拜拜肉的有效四招
1、兩手握拳，拳對拳兩手在胸前齊平，然後勻速往後背舒展，來回反複做15組。2、練習做平闆支撐10組，... 2023-07-07
生活地暖怎麼放氣
1、地暖可以通過回水閥門放氣。2、這是地暖的分水器簡單構成介紹，主要包括：供水閥門、回水閥門。3、首... 2023-07-07
生活美國五角大樓是什麼
1、美國五角大樓是美國國防部的辦公大樓,位于華盛頓西南方弗吉尼亞州阿靈頓縣,因建築物為五角形而得名,... 2023-07-07
生活生肖兔2020年運勢大全
1、事業方面，屬兔的朋友們在2020年的事業運勢比較穩定。在職場人際交往方面會有不錯的運氣，貴人運強... 2023-07-07
生活盆栽防暴雨方法
1、要适當修枝疏葉，控制澆水，少施氮肥，必要時可采用葉面噴灑澆水，促使枝條壯實，增強抗病能力，促進花... 2023-07-07
生活樂不思鼠是什麼梗
1、這個梗主要來自于抖音一個叫電氣鼠的博主，這個美女腿長，身材好，顔值高，受到很多宅男喜愛。她的視頻... 2023-07-07
生活酵母怎麼保存
1、活性幹酵母的正确儲存方法酵母開袋後把開口封嚴，可在常溫儲存1年左右，保質期不低于6個月，無需冷藏... 2023-07-07
生活密鑰在哪裡可以找到
1、電腦激活秘鑰查找方法：在win10系統下，打開電腦的運行窗口，輸入cmd，按回車，之後輸入“sl... 2023-07-07
生活豆瓣醬怎麼保存
1、豆瓣醬平時可以保存在塑料袋或者可以密封的玻璃瓶中，然後把它放在陰涼通風的環境中，可以保存幾個月不... 2023-07-07
生活大白菜u盤裝系統要不要解壓
1、大白菜u盤裝系統不需要解壓。2、使用大白菜U盤裝系統是很常見的做法，制作好大白菜U盤之後，還需要... 2023-07-07
生活大棚韭菜出現黃葉怎麼解決
1、大棚韭菜出現黃葉的原因溫差太大，高溫高濕容易引起韭菜葉片黃葉幹尖。空氣流通不好，通風不良，保護地... 2023-07-07
生活暖寶寶可以上飛機托運嗎
1、可以的。暖寶寶的主要成分是鐵粉、活性炭、蛭石、樹脂、水和食鹽。這裡面沒有違禁物品，不打開包裝是不... 2023-07-07
生活基本醫療保險是啥
1、基本醫療保險是為補償勞動者因疾病風險造成的經濟損失而建立的一項社會保險制度。通過用人單位和個人繳... 2023-07-07
生活物流是什麼
1、物流是物品從供應地向接收地的實體流動過程中，根據實際需要，将運輸、儲存、裝卸搬運、包裝、流通加工... 2023-07-07
生活給人帶來好運氣的名字
1、文盛、世博、志峻、秀辰、榮棋、霜波、貴博、泰輝2、宇達、乾元、宇塵、睿博、昌崇、濤鴻、文玉、博豪... 2023-07-07
生活什麼是頭寸
1、頭寸（position）是一個金融術語，指的是個人或實體持有或擁有的特定商品、證券、貨币等的數量... 2023-07-07
生活下巴上長痘痘的原因
1、中醫認為，下巴長痤瘡與腎相關。下巴兩側屬中醫肝經循行的部位與肝火亢盛相關，下巴連及口唇周圍與脾胃... 2023-07-07
生活用艾草洗頭有什麼好處
1、在一些特殊時期用艾葉水洗頭，可以避免受寒，而且用艾葉水洗頭，還可以止癢去屑，對脂溢性脫發也有一定... 2023-07-07
生活手機能用word文檔發郵件嗎
1、打開手機中的郵件程序，或者在微信的QQ郵箱提醒中點擊“寫郵件”按鈕。2、進入新郵件編輯頁面，點擊... 2023-07-07
生活物品的采購如何分類
1、常規的的重要物資，此類物品供應商多，采購較為簡單，但相對的價值較高，對企業生産較為重要。2、緊缺... 2023-07-07
生活光波爐可以當烤箱用嗎
光波爐不可當烤箱用，因為兩者大有區别：1、原理不同，光波爐以光波作為加熱來源，以遠紅外發熱、玻璃光波... 2023-07-07
生活微信發視頻如何不被壓縮
1、打開手機微信。2、選擇發送對象。3、聊天窗口點擊加号。4、菜單選項點擊照片。5、選擇要發送的視頻... 2023-07-07
生活紅掌的葉子發黃了是什麼原因
1、紅掌的葉子發黃，通常是因為光照不夠充足，葉片無法進行足夠的光合作用合成更多養分便會發黃，嚴重了甚... 2023-07-07

tft每日頭條

> 生活

> 集成建模技術

集成建模技術

相关生活资讯推荐

热门生活资讯推荐

网友关注