谷歌tpu簡單版-tft每日頭條

谷歌tpu簡單版

生活更新时间:2025-08-15 10:39:09

智東西（公衆号:zhidxcom）

編 | 海中天

導讀：在2017年谷歌I/O大會上，二代TPU亮相，它比一代TPU更強大。到底TPU是什麼？有什麼新的變化？Nextplatform記者Nicole Hemsoth一個月前采訪了谷歌著名硬件工程師Norman Jouppi，打聽了一些内幕，他還收集了許多資料，對二代TPU深入分析。

讓我們聽聽Nicole Hemsoth是怎樣解釋的：

谷歌tpu簡單版（谷歌二代TPU到底有什麼秘密）1

一個月前，我曾與谷歌著名硬件工程師Norman Jouppi交流過，讨論的重點是TPU（tensor processing unit），谷歌用TPU讓深度學習推理加速，不過設備（第一代TPU）已經有點過時了。

在今年的I/O大會上，谷歌奪走了Volta GPU的風頭，Volta GPU是Nvidia最近推出的，谷歌透露了二代TPU的細節，二代TPU系統闆的運算速度達到180萬億次，相當驚人，它既可以訓練，也可以推理，定制網絡将TPU組合成“TPU Pods”，計算能力可以與世界前500強的超級計算機媲美，最高峰值速度達到11.5 petaflops（每秒千萬億次）。

Dean解釋說：“我們擁有一個才華橫溢的ASIC設計團隊，他們開發了第一代TPU，還有許多同類的人參與項目。與一代TPU相比，二代TPU的設計與整體系統更接近，它更小，因為我們隻在一塊芯片上推理。訓練流程要求更高，因為我們既要從整體上思考底層設備，還要理解它們是如何與大型系統連接的，比如Pods。”

我們将會密切關注谷歌，深入了解定制網絡架構，下面這些資料是我們從預先準備的高級簡報中提煉出來的，它們與最新的TPU有關；我們還試圖理解新TPU是如何組成機櫃、堆疊在一起的，最終它們的性能達到超級計算機的水平。谷歌沒有透露二代TPU芯片或者主闆的規格，不過幸好有一張圖片，我們可以由此向後進行數學推導。

有些人可能看過許多的超級計算機主闆，對于他們來說，谷歌TPU2與Cray XT或者XC架構也許有點像，這點很有趣，隻是互聯的芯片似乎是焊接在主闆中央的，連接外部世界的接口放在主闆外部。TPU2共有4個TPU2單元，每一個的最大峰值吞吐量（Peak Throughput）約為180萬億次，這點我們在上文已經提到過。我們姑且假定它所使用的是16位半精度浮點。

主闆的左側和右側各有4個連接接口，左側還有2個接口。如果每一個TPU2闆卡直接連接到閃存，那将是十分有趣的一件事，AMD未來即将推出的Vega Radeon Instinct GPU加速器就是這樣設計的。左側的另外2個接口可以直接連接到存儲單元，或者向上連接到網絡的更高層級，從而讓TPU互聯起來，形成更複雜的處理系統。

如果非要猜測，每一個TPU2單元應該有2個接口連接到外部世界，跨越機櫃，左側兩個多出來的接口一個用來連接本地存儲單元，一個作為機櫃内部的互聯節點。

下面就是TPU2主闆“Pod”的樣貌，谷歌說它們處理機器學習數據的整體能力達到11.5 petaflops（千萬億次）。

谷歌tpu簡單版（谷歌二代TPU到底有什麼秘密）2

仔細觀察就會發現，它們似乎是“Open Compute（開放計算）”機櫃，或者說它的尺寸與Open Compute機櫃差不多，可能稍寬一些。上面共有8行TPU單元，每組有4塊TPU闆卡，水平放置。這些機櫃到底是全深度機櫃還是一半深度，我們無法清楚知道。你可以看到TPU2機櫃的計算節點從一側伸出來，這一側有6個接口，當中的2個接口向上連接到一個機框。

在TPU2 機框的最頂行，兩個接口向上延伸，進入另一個機框，裡面似乎沒有安裝TPU2單元。照猜測它是一個準系統（Bare bone）閃存機框，以很高的速度為TPU存儲本地數據。不論怎樣，主闆至少有32個TPU2，也就是說一個機櫃至少有128個TPU。計算一下就會知道，每一個Pod由2個機櫃和藍色罩子組成，它的計算力應該是11.5 petaflops。

在生産端，如此強大的計算力到底有什麼好處呢？谷哥最新的大型翻譯模塊是用32個最棒的商用GPU（可能是Pascal）訓練的，要花一整天訓練，現在隻需要1/8的TPU就能在一個下午完成。請注意，TPU是專門為TensorFlow優化過的，商用GPU（哪怕是高端GPU）瞄準的是通用目的，它既要完成高精度工作，也要完成低精度工作。從這個案例就可以看出，谷歌推出自有ASIC在投資回報方面是沒有什麼問題的。

還有一點要注意，第一代TPU也許已經擁有強大的推理能力，既快速又高效，不過模型必須先從GPU訓練集群中移出，如果要将新模型或者重新訓練的模型正式部署起來，實驗過程就會變慢，谷歌開發者必須等更長的時間才能拿到結果，然後重複工作。正是因為這個原因，對于深度學習硬件來說，在單個設備上訓練/推理就是研究的“聖杯”，現在我們終于走到了轉折點，可以用多種方法解決此問題；未來還可以用英特爾 Knights Mill或者Nvidia Volta GPU。

Nvidia的Volta GPU有一些“tensor core”的處理元素，它可以讓機器學習訓練加速，處理超級計算任務時也會更快，Volta GPU在單個設備上的速度可以達到120 teraflops，相比一年前發布的Pascal進步很多。雖然Volta GPU很驚人，不過谷歌的産品還是奪走Nvidia的一些風頭，雖然短期之内用戶無法自己動手自制TPU機器。

Dean說Volta架構很有趣，因為Nvidia意識到核心矩陣相乘原語（core matrix multiply primitive）對于應用的加速而言相當重要。他還說，谷歌第一代TPU用相似的方法提高推理時矩陣相乘的速度，不過設備是在機器學習工作流中實現這一點的。他還說：“加快線性代數運算速度一直個好方法。”

先将硬件放在一邊不談，讓我們從用戶角度看一看。谷歌沒有将秘密保護起來，在不久的将來，谷歌會通過“谷歌雲平台”使用TPU。谷歌高級研究員Jeff Dean說，他們不會限制競争，TPU隻是作為一種選擇提供給用戶，還會提供Volta GPU，繼續使用Skylake Xeons，開發者構建、運行模型時，谷歌會提供幾種選擇。谷歌将會在雲計算中裝備1000個TPU，提供給合格的研究團隊使用，這些團隊正在完成開放科研項目，它們也許願意将自己的機器學習成果開放。

Dean解釋說，谷歌内部完成一些機器學習任務時可能仍然會使用GPU和CPU，在同一款設備中同時使用兩種訓練和推理技術有着巨大的潛力，設備專為TensorFlow優化過，它也許會打破平衡。新TPU能耗如何我們現在還不知道，不過第一代設備能耗很低，如果用它作為标準評估新設備也許不合适，因為新設備既可以訓練也可以推理。我們可以推斷新TPU的能耗比Volta低，畢竟無論哪個方面來看Volta都是一款更大的設備，而且Volta可以完成多種工作，比如運行一些HPC應用，它們需要進行64位浮點運算，Volta還可以做一些機器學習超低精度運算工作。Nvidia已經将FP16（16位浮點運算）技術标準化，用戶可以根據工作改變精度，隻是我們必須假定新的TPU架構是16位或者8位的。

谷歌tpu簡單版（谷歌二代TPU到底有什麼秘密）3

關于這一點，Dean說：“第一代産品支持量子化整數運算，第二代支持浮點運算。一旦模型的推理訓練結束，可以用來運行量化算法，就沒有必要改變模型了，在整個訓練和推理過程中可以使用相同的浮點數表示法，部署起來也會更容易。”

谷歌沒有将定制硬件推向市場，這對于Nvidia、英特爾來說是一件好事，因為在這個市場Nvidia與英特爾都想占據上風，而谷歌的TPU很有競争力。将二代TPU放進谷歌雲平台，無疑可以幫助一些人完成規模化訓練，不過正如上文提到的，完成這些工作時既會用到高端GPU，也會用到CPU。用戶可以在架構上大規模使用TensorFlow，而架構本身就是針對TensorFlow設計的，這點也很吸引人。谷歌的舉動會激怒亞馬遜和微軟，它們可能會加速引進最新的GPU，以前它們的速度比較慢。亞馬遜使用的最高端GPU是 Tesla K80，微軟Azure使用的是Pascal P100s。

有些人可能感到奇怪，為什麼谷歌不将芯片商用呢？仔細閱讀上文，看看谷歌做了一些什麼，就會發現它選擇的路線不是直接的，風險也比較小。如果深度學習市場像預料的一樣擴張，TPU和TensorFlow也許會帶來差異化，這種差異化如果足夠大，就會讓谷歌雲平台擁有更大的優勢，這種優勢是之前沒有過的。然後谷歌就可以大規模生産，進入大衆市場，這樣谷歌就可以有序擴張TensorFlow了。

多年前，谷歌就曾說過“不作惡”。老實說，在Volta推出之時展示一頭這樣的怪獸的确有點邪惡。

谷歌tpu簡單版（谷歌二代TPU到底有什麼秘密）4

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活黃曲黴素高溫能殺死嗎
1、黃曲黴素分解溫度為268℃紫外線對低濃度黃曲黴毒素有一定的破壞性，标準做法是過長時間高溫（100... 2023-07-06
生活吃山竹有哪些禁忌事項
1、山竹富含纖維素，在腸胃中會吸水膨脹，過多食用反而會引起便秘。2、山竹屬寒性水果，所以體質虛寒者少... 2023-07-06
生活茴香怎麼保存
1、新鮮茴香可以直接置于常溫下保存，這也是生活中比較常見的一種保存方法，但是這樣保存時間會比較短，可... 2023-07-06
生活冰箱玻璃面有水怎麼去除
1、内部清潔時，請使用柔和清潔劑将冰箱内壁和各種部件清洗一遍，并用柔軟的抹布擦幹。2、外部清洗時，用... 2023-07-06
生活蜂蜜柚子茶用什麼蜂蜜
蜂蜜柚子茶可以用洋槐蜜、棗花蜜還有土蜂蜜制作。洋槐蜜和棗花蜜不容易結晶，做出來的柚子茶比較美觀；土蜂蜜沒有經過任何的勾兌處理，味道比較甘甜，營養價值很高。蜂蜜柚子茶适合用沙田柚或胡柚制作。沙田柚個小皮薄，果肉充足，味甜，适合用來制作蜂蜜柚子茶；胡柚的果肉水潤豐富，而且維生素C的含量比較高，也可以用來... 2023-07-06
生活 CBD全稱是什麼
1、CBD是CentralBusinessDistrict的縮寫，中央商務區。2、中央商務區（CBD... 2023-07-06
生活雪紡方領領口大了怎麼改小竅門
1、先用針線把變大了的領口穿起來收緊，把衣領收到合适的大小。用熨鬥反複熨燙領口。把縫上的線拆掉，如果... 2023-07-06
生活臘月二十六年俗有哪些
1、關于臘月二十六，民間還流傳着“臘月二十六割年肉”的說法，也就是說，從這一天起要開始置辦年貨了。在... 2023-07-06
生活如何開網店
1、首先登陸淘寶賬号。2、點擊賣家中心”我要開店”免費開店”。3、上傳一張頭部和身份證照片。4、等待審核通過，顯示已認證”。5、将支付寶和銀行賬戶相捆綁。6、完成認證，點擊我要買”發布寶貝”即可。 2023-07-06
生活指環王主人公屬于哪個矮人族
指環王主人公屬于哪個矮人族《指環王》主人公屬于霍比特人一族。《指環王》又稱《魔戒》，是由彼得·傑克遜執導，伊利亞·伍德、伊恩·麥克萊恩、維戈·莫特森等主演的奇幻系列電影。主人公佛羅多·巴金斯是心地善良的霍比特人，是魔戒三部曲的主角。從叔叔比爾博處繼承了魔戒，自此開始逃亡之旅，在林谷會議上自願提出将魔... 2023-07-06
生活西瓜子是夏天常吃的西瓜裡的籽嗎
1、不是的。一般來說，人們日常吃的西瓜裡的籽也可以做成西瓜子，但是個頭太小，因此市面上産的西瓜子通常... 2023-07-06
生活感應式水表怎麼刷卡
1、感應式水表的感應區一般在表上、出水口上方、表體的側面，用卡直接貼在感應區上就可以了。2、IC卡智能水表是一種利用現代傳感技術、現代微電子技術、以及IC卡技術對用水量進行計量并進行用水數據傳遞及結算交易的新型水表。它除了可對用水量進行記錄和電子顯示外，還可以按照約定對用水量自動進行控制，并且自動完... 2023-07-06
生活新鮮金銀花怎麼烘幹
１、晾曬烘幹：這是最原始的一種方法，它不需要借助其它的機器設備就可以完成，但是很受環境和天氣的影響。... 2023-07-06
生活沒有買過社保的可以補交社保嗎
1、可以。2、有單位：單位和個人按比例繳納社會保障金。3、無單位：如果您失業，您可以在領取失業救濟金... 2023-07-06
生活放置江湖書籍疊滿10個有什麼用
1、10本是為了藏書值沖排行榜2、書籍獲得方大學，第八章節-青城山-書房3、論語，黃河幫學館書架4、... 2023-07-06
生活淘寶中怎麼申請退貨退款
第一、打開淘寶，輸入自己的淘寶賬号和密碼，點擊登錄第二、然後點擊我的淘寶，進入到淘寶頁面，點擊左側方，已買到的寶貝第三、然後點擊商品右方的退貨/退款第四、然後服務類型勾選退貨退款，再選擇退款原因和金額，然後點擊提交。提交後等待商家同意退貨退款。你再把商品給快遞回去，商家收到商品後，把貨款退給你，這樣... 2023-07-06
生活有效減肥的科學方法
1、每天堅持有氧運動。可以這麼說吧，有氧運動是肥胖的克星，要堅持做，男士可以選擇跑步、太極拳、籃球、... 2023-07-06
生活狗狗腿斷了怎麼接
第一、狗狗如果腿斷了，應該第一時間先讓狗狗盡量不要有太大的刺激性動作，就讓狗狗趴在原地。第二、可以抓緊時間檢查一下斷腿的情況，如果說有大面積出血的話，應該第一時間先給狗狗止血，然後送到專門的寵物醫院第三、可以選擇先給狗狗拍一個片子，看看他的斷腿情況，根據醫生的判斷進行下一步處理。如果需要藥物治療，那... 2023-07-06
生活樓房怎樣儲存大蘿蔔
樓房儲存大蘿蔔的方法：蘿蔔去葉子去根，清洗幹淨。放在通風處自然陰幹。用保鮮膜密封好，确保不漏氣，放進冰箱保鮮室5度上下的溫度保存。白蘿蔔中含有豐富的芥子油、粗纖維、澱粉酶以及多種氨基酸、微量元素等，能夠幫助促進腸胃蠕動，消除便秘，有效排除體内毒素，适量食用對身體有益。蘿蔔：蘿蔔十字花科蘿蔔屬二年或一... 2023-07-06
生活秋梨膏的意思是什麼
1、秋梨膏，網絡流行語，“求你了”的諧音，就是指求你了的意思。來源于鬥魚CSGO主播茄子在直播時說話... 2023-07-06
生活洛陽牡丹花期是幾月份
1、很多人不清楚洛陽牡丹花期是幾月份，通常是在4～5月份，并且在4月5日～5月5日之間會舉辦牡丹節，此時百花齊放，姹紫嫣紅，可以在裡面觀賞到一些稀有珍貴的牡丹，例如龍門石窟、白馬寺等景點都是觀賞的不錯的景點。2、牡丹的品種不同所以花期時間是有一定的區别的，早期的牡丹花開花的時間會集中在4月5日～4月... 2023-07-06
生活火災逃生方法
迅速撤離法：當進入公共場所時，要留意其牆上、頂棚上、門上、轉彎處設置的“太平門”、“緊急出口”、“安... 2023-07-06
生活怎麼挑選最好的春筍
1、節要密：鮮筍節與節之間的距離越短，則筍肉越厚越嫩。2、殼要大：殼大尖小的筍去殼後出肉率高．隻要指... 2023-07-06
生活如何做鉛筆字賀卡
1、準備一張紙，剪刀，鉛筆，水彩筆。2、畫花邊，剪花邊。3、畫愛心，用鉛筆寫大字。4、用黑筆，描鉛筆... 2023-07-06
生活學生票一年4次怎麼算
1、學生票一年四次規定使用方法：每年可購買四次家庭居住地到學校的往返火車硬座半價客票、加快票和空調票... 2023-07-06
生活柚子剝開有水還能吃嗎
1、一般來說，柚子剝開之後有水是正常的，市面上的大多數柚子在采摘的時候會在外面包裹上一層紙，等到成熟... 2023-07-06
生活白短袖發黃怎麼洗白
1、用淘米水，盆中放入淘米水，放上衣服浸泡一天，然後倒入洗潔精，輕柔搓洗，用清水清洗幹淨就可。2、用... 2023-07-06
生活廁所堵了用什麼方法可以解決
1、小蘇打+白醋，廁所馬桶堵了要想疏通，可倒一些小蘇打進去，接着再倒些白醋。小蘇打和白醋的比例是1:... 2023-07-06
生活鬼吹燈之龍嶺迷窟在哪個平台播出
1、電視劇《鬼吹燈之龍嶺迷窟》将于2020年04月01日起在騰訊視頻上映播出，将在騰訊視頻播出，每周三20點更新，一天更新三集，會員提前看一周，4月22日可觀看大結局，總共有18集。2、《鬼吹燈之龍嶺迷窟》這部網絡劇是改編自天下霸唱鬼吹燈”系列的第二部，這部劇應該是延續了精絕古城”之後的劇情，也就是... 2023-07-06
生活銀行卡賬戶過期怎麼辦
1、銀行卡過期可以拿着本人有效身份證和舊銀行卡到當地銀行網點辦理換卡手續。2、一般情況銀行卡到期前，... 2023-07-06

tft每日頭條

> 生活

> 谷歌tpu簡單版

谷歌tpu簡單版

相关生活资讯推荐

热门生活资讯推荐

网友关注