ai算法每月提速多少-tft每日頭條

ai算法每月提速多少

科技更新时间:2025-08-09 07:45:58

ai算法每月提速多少（AI系統梯度累積算法）1

明天博士論文要答辯了，隻有一張12G二手卡，今晚通宵要搞定10個模型實驗
挖槽，突然想出一個T9開天霹靂模型，加載不進去我那張12G的二手卡，感覺要錯過今年上台Best Paper領獎

上面出現的問題主要是機器不夠、内存不夠用。在深度學習訓練的時候，數據的batch size大小受到GPU内存限制，Batch size大小會影響模型最終的準确性和訓練過程的性能。在GPU内存不變的情況下，模型越來越大，那麼這就意味着數據的batch size智能縮小，這個時候，梯度累積（Gradient accumulation）可以作為一種簡單的解決方案來解決這個問題。

下面這個圖中橙色部分HERE就是梯度累積算法在AI系統中的大緻位置，一般在AI框架/AI系統的表達層，跟算法結合比較緊密。

ai算法每月提速多少（AI系統梯度累積算法）2

Batch size的作用

訓練數據的Batch size大小對訓練過程的收斂性，以及訓練模型的最終準确性具有關鍵影響。通常，每個神經網絡和數據集的Batch size大小都有一個最佳值或值範圍。

不同的神經網絡和不同的數據集可能有不同的最佳Batch size大小。

選擇Batch size的時候主要考慮兩個問題：

泛化性：大的Batch size可能陷入局部最小值。陷入局部最小值則意味着神經網絡将在訓練集之外的樣本上表現得很好，這個過程稱為泛化。因此，泛化性一般表示過度拟合。

收斂速度：小的Batch size可能導緻算法學習收斂速度慢。網絡模型在每個Batch的更新将會确定下一次Batch的更新起點。每次Batch都會訓練數據集中，随機抽取訓練樣本，因此所得到的梯度是基于部分數據噪聲的估計。在單次Batch中使用的樣本越少，梯度估計準确度越低。換句話說，較小的Batch size可能會使學習過程波動性更大，從本質上延長算法收斂所需要的時間。

考慮到上面兩個主要的問題，所以在訓練之前需要選擇一個合适的Batch size。

ai算法每月提速多少（AI系統梯度累積算法）3

Batch size對内存的影響

雖然傳統計算機在CPU上面可以訪問大量RAM，還可以利用SSD進行二級緩存或者虛拟緩存機制。但是如GPU等AI加速芯片上的内存要少得多。這個時候訓練數據Batch size的大小對GPU的内存有很大影響。

為了進一步理解這一點，讓我們首先檢查訓練時候AI芯片内存中内存的内容：

模型參數：網絡模型需要用到的權重參數和偏差。
優化器變量：優化器算法需要的變量，例如動量momentum。
中間計算變量：網絡模型計算産生的中間值，這些值臨時存儲在AI加速芯片的内存中，例如，每層激活的輸出。
工作區Workspace：AI加速芯片的内核實現是需要用到的局部變量，其産生的臨時内存，例如算子D=A B/C中B/C計算時産生的局部變量。

因此，Batch size越大，意味着神經網絡訓練的時候所需要的樣本就越多，導緻需要存儲在AI芯片内存變量激增。在許多情況下，沒有足夠的AI加速芯片内存，Batch size設置得太大，就會出現OOM報錯（Out Off Memor）。

使用大Batch size的方法

解決AI加速芯片内存限制，并運行大Batch size的一種方法是将數據Sample的Batch拆分為更小的Batch，叫做Mini-Batch。這些小Mini-Batch可以獨立運行，并且在網絡模型訓練的時候，對梯度進行平均或者求和。主要實現的有兩種方式。

1）數據并行：使用多個AI加速芯片并行訓練所有Mini-Batch，每份數據都在單個AI加速芯片上。累積所有Mini-Batch的梯度，結果用于在每個Epoch結束時求和更新網絡參數。

2）梯度累積：按順序執行Mini-Batch，同時對梯度進行累積，累積的結果在最後一個Mini-Batch計算後求平均更新模型變量。

雖然兩種技術都挺像的，解決的問題都是内存無法執行更大的Batch size，但梯度累積可以使用單個AI加速芯片就可以完成啦，而數據并行則需要多塊AI加速芯片，所以手頭上隻有一台12G二手卡的同學們趕緊把梯度累積用起來。

梯度累積原理

梯度累積是一種訓練神經網絡的數據Sample樣本按Batch拆分為幾個小Batch的方式，然後按順序計算。

在進一步讨論梯度累積之前，我們來看看神經網絡的計算過程。

深度學習模型由許多相互連接的神經網絡單元所組成，在所有神經網絡層中，樣本數據會不斷向前傳播。在通過所有層後，網絡模型會輸出樣本的預測值，通過損失函數然後計算每個樣本的損失值（誤差）。神經網絡通過反向傳播，去計算損失值相對于模型參數的梯度。最後這些梯度信息用于對網絡模型中的參數進行更新。

優化器用于對網絡模型模型權重參數更新的數學公式。以一個簡單随機梯度下降(SGD)算法為例。

假設Loss Function函數公式為：

ai算法每月提速多少（AI系統梯度累積算法）4

在構建模型時，優化器用于計算最小化損失的算法。這裡SGD算法利用Loss函數來更新權重參數公式為：

ai算法每月提速多少（AI系統梯度累積算法）5

其中theta是網絡模型中的可訓練參數（權重或偏差），lr是學習率，grad是相對于網絡模型參數的損失。

梯度累積則是隻計算神經網絡模型，但是并不及時更新網絡模型的參數，同時在計算的時候累積計算時候得到的梯度信息，最後統一使用累積的梯度來對參數進行更新。

ai算法每月提速多少（AI系統梯度累積算法）6

在不更新模型變量的時候，實際上是把原來的數據Batch分成幾個小的Mini-Batch，每個step中使用的樣本實際上是更小的數據集。

在N個step内不更新變量，使所有Mini-Batch使用相同的模型變量來計算梯度，以确保計算出來得到相同的梯度和權重信息，算法上等價于使用原來沒有切分的Batch size大小一樣。即：

ai算法每月提速多少（AI系統梯度累積算法）7

最終在上面步驟中累積梯度會産生與使用全局Batch size大小相同的梯度總和。

ai算法每月提速多少（AI系統梯度累積算法）8

當然在實際工程當中，關于調參和算法上有兩點需要注意的：

學習率 learning rate：一定條件下，Batch size越大訓練效果越好，梯度累積則模拟了batch size增大的效果，如果accumulation steps為4，則Batch size增大了4倍，根據ZOMI的經驗，使用梯度累積的時候需要把學習率适當放大。 歸一化 Batch Norm：accumulation steps為4時進行Batch size模拟放大效果，和真實Batch size相比，數據的分布其實并不完全相同，4倍Batch size的BN計算出來的均值和方差與實際數據均值和方差不太相同，因此有些實現中會使用Group Norm來代替Batch Norm。

梯度累積實現

正常訓練一個batch的僞代碼：

for i, (images, labels) in enumerate(train_data): # 1. forwared 前向計算 outputs = model(images) loss = criterion(outputs, labels) # 2. backward 反向傳播計算梯度 optimizer.zero_grad() loss.backward() optimizer.step()

model(images) 輸入圖像和标簽,前向計算。
criterion(outputs, labels) 通過前向計算得到預測值，計算損失函數。
ptimizer.zero_grad() 清空曆史的梯度信息。
loss.backward() 進行反向傳播，計算當前batch的梯度。
optimizer.step() 根據反向傳播得到的梯度，更新網絡參數。

即在網絡中輸入一個batch的數據，就計算一次梯度，更新一次網絡。

使用梯度累加後：

# 梯度累加參數 accumulation_steps = 4 for i, (images, labels) in enumerate(train_data): # 1. forwared 前向計算 outputs = model(imgaes) loss = criterion(outputs, labels) # 2.1 loss regularization loss正則化 loss = loss / accumulation_steps # 2.2 backward propagation 反向傳播計算梯度 loss.backward() # 3. update parameters of net if ((i 1) % accumulation)==0: # optimizer the net optimizer.step() optimizer.zero_grad() # reset grdient

model(images) 輸入圖像和标簽,前向計算。
criterion(outputs, labels) 通過前向計算得到預測值，計算損失函數。
loss / accumulation_steps loss每次更新，因此每次除以steps累積到原梯度上。
loss.backward() 進行反向傳播，計算當前batch的梯度。
多次循環僞代碼步驟1-2，不清空梯度，使梯度累加在曆史梯度上。
optimizer.step() 梯度累加一定次數後，根據所累積的梯度更新網絡參數。
optimizer.zero_grad() 清空曆史梯度，為下一次梯度累加做準備。

梯度累積就是，每次獲取1個batch的數據，計算1次梯度，此時梯度不清空，不斷累積，累積一定次數後，根據累積的梯度更新網絡參數，然後清空所有梯度信息，進行下一次循環。

參考文獻

[1] Hermans, Joeri R., Gerasimos Spanakis, and Rico Möckel. "Accumulated gradient normalization." Asian Conference on Machine Learning. PMLR, 2017.
[2] Lin, Yujun, et al. "Deep gradient compression: Reducing the communication bandwidth for distributed training." arXiv preprint arXiv:1712.01887 (2017).
[3] how-to-break-gpu-memory-boundaries-even-with-large-batch-sizes
[4] what-is-gradient-accumulation-in-deep-learning

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技硬盤怎麼選
選購硬盤主要看類型和容量。1、類型。硬盤分為機械硬盤和固态硬盤，固态硬盤讀取速度更快、低功耗、輕便、... 2023-06-29
科技巴博斯s系售價
1、巴博斯s系廠商指導價：156.8萬。2、德國巴博斯——世界最頂級的轎車改裝公司，主要對奔馳轎車進... 2023-06-29
科技吸濾瓶用途和注意事項
吸濾瓶是一種類似有一個分支的錐形瓶，且能夠進行真空反應的玻璃儀器，可以作為少量氣體的制取發生器，能利用真空泵等儀器改變裡面的壓強。注意事項：1、安裝時，布氏漏鬥頸的斜口要遠離且面向吸濾瓶的抽氣嘴。抽濾時速度（用流水控制）要慢且均勻，濾液不能超過抽氣嘴。2、抽濾過程中，若漏鬥内沉澱物有裂紋時，要用玻璃棒及時壓緊消除，以保證吸濾瓶的低壓，便于吸濾。 2023-06-29
科技微信拍拍怎麼用
1、打開手機微信，點擊進入對好友的聊天對話頁面。2、雙擊對方的頭像，當頭像出現震動效果之後，表示成功... 2023-06-29
科技特效煙霧制作方法
1、新建一個合成，大小1280x720，幀速率25，持續時間10秒。點擊确定。在新建一個固态層點擊确... 2023-06-29
科技手機截屏怎麼弄
1、打開手機。2、打開需要截屏的界面後，向下滑動屏幕，出現“通知”和“并關”界面，選擇“開關”界面。... 2023-06-29
科技蘋果6如何升級ios13
1、電腦搜愛思助手，進入網站；2、下載愛思助手PC端，點擊安裝；3、用數據線把電腦和蘋果設備連接起來... 2023-06-29
科技 qq群設置在哪裡
1、首先打開手機QQ，點擊進入聯系人”頁面，并找到知群聊”選項。2、然後在群聊中找到需要進行群設置的QQ群。3、進入該群後，點擊右上角的頭像”圖标就可以進入設置頁面了。 2023-06-29
科技發動機溫度過高是怎麼回事
1、車輛若長時間行駛在土路或泥濘路段，會有一些髒物粘附在散熱器上，久而久之，會影響散熱效果，造成水溫過高。2、如果節溫器工作不正常，也會導緻發動機溫度過高。一般通過連接節溫器的上小水管的溫度差來判斷。若兩水管溫差較大，即可判為節溫器不工作。3、如果冷卻系統中有空氣，會形成氣阻，使冷卻水循環不良，同樣也會導緻發動機溫度過高。4、夏天天氣炎熱、汽車長時間在高溫下行駛，水箱容易出現"開鍋"的現象，即防凍 2023-06-29
科技電腦休眠後怎麼喚醒
1、處于睡眠狀态時，想恢複原來的工作狀态，隻需按下鍵盤上的任意按鍵或移動鼠标，即可從電腦休眠中喚醒系統。2、進入休眠狀态後，假如要重新使用主機，需要按下電源按鈕啟動電腦；或者你可以按自己的鍵盤或者鼠标就可以喚醒電腦了。 2023-06-29
科技電腦怎麼截圖快捷鍵
1、使用鍵盤中的PrintScrSysrq鍵實現全屏截圖。PrintScrSysrq鍵，其位于鍵盤的... 2023-06-29
科技設置pin是什麼意思
演示機型：華為MateBookX系統版本：win10電腦pin碼是使用比較多的一種身份識别技術，随機生成可驗證的一組身份驗證識别序列，但pin碼隻能使用一次。pin碼是一種身份識别技術，達到時間限制或者已經使用後立即失效。密碼都是經過md5或者其他加密方式，都存在被破解的風險，而pin碼的出現，可以提高安全性。PIN1碼和PIN2碼的功能：PIN1碼：PIN1碼是個人識别碼。是SIM卡内部的一個存 2023-06-29
科技 qq群老是要驗證
1、打開電腦QQ控制面闆，點擊左下角的按鈕，進入後選擇設置。2、進入設置界面後，選擇上方權限設置按鈕... 2023-06-29
科技身份證能放到手機後面嗎
1、偶爾一次可以，不要長期這樣，身份證是有磁性的，如果磁性消失以後刷身份證就用不了。2、第二代居民身... 2023-06-29
科技手機怎麼用藍牙
1、首先打開自己的手機，在手機的桌面上找到設置并且點擊【設置】。2、進入設置頁面以後，在藍牙中将藍牙... 2023-06-29
科技簡述液力機械自動變速器的特點
1、液力自動變速器的基本結構是由液力變矩器與動力換檔的輔助變速裝置組成。液力變矩器安裝在發動機和變速... 2023-06-29
科技電腦軟件安裝教程
1、首先，我們下載一個安裝程序在桌面上，然後我們雙擊這個程序。2、彈出的界面，我們點擊是。3、然後我... 2023-06-29
科技弘曕和靈犀結局
1、靈犀長大後愛上了同父異母的哥哥元澈，甄嬛也就狠心拆散了兩人，之後靈犀看破紅塵，遁入空門。2、弘曕... 2023-06-29
科技電腦本地已連接有防火牆不能上網
1、手動設置IP：方法是打開“控制面闆”——“網絡連接”，找到當前的本地連接，右擊它，選“屬性”，在... 2023-06-29
科技康佳電視開不了機怎麼回事
1、可能是電視機處于待機狀态開不了機；檢查是否按了電視機遙控器的待機鍵關掉了電視機的屏幕顯示，使電視處于待機狀态，可再按一次遙控器的待機鍵來喚醒屏幕，恢複正常。2、顯像管出了問題，需要更換顯像管，最好請維修人員，自己很難解決。3、電視打開電源指示燈正常，用遙控器不能啟動，可能主電壓不正常。等半小時自己好了，為電源主電壓電路有脫焊而引起接觸不良。4、如果是硬件故障導緻的，具體包括電源故障、開關電路短 2023-06-29
科技小米手機wifi網速慢的解決辦法
1、首先打開手機設置裡的WiFi功能确認已連接。2、點擊已連接的WiFi右邊有個小箭頭。3、然後會進... 2023-06-29
科技 nikon相機怎麼使用教程
1、首先我們來看單反相機正面的按鍵，作為專業單反，在按鍵功能上要比入門單反豐富很多，比如景深預覽鍵就... 2023-06-29
科技電腦黑屏怎麼辦開機開起來還是黑的
1、首先重新連接顯示器接線，或者更換接線，排查是否是接線問題；2、如果主機有雙顯卡，更換另一個顯卡測... 2023-06-29
科技 net40是什麼
全稱netframework4.0。是Microsoft.NETFramework的4.0版本，是用于Windows的新托管代碼編程模型。NETFramework安全解決方案基于管理代碼的概念，以及由通用語言運行時（CLR）加強的安全規則。大部分管理代碼需要進行驗證以确保類型安全及預先定義好的其它屬性的行為的安全。安全策略包含了許多代碼組，這些組包含了根據證據應給予的許可權。代碼組描述的許可可提供 2023-06-29
科技女性懷孕能給自己身體帶來哪些益處
第一、減少子宮肌瘤發病率，子宮肌瘤應該是很多人都聽說過的一種疾病，對于女性來說非常的常見，尤其是沒有懷孕生過孩子的女性發病率往往比較高一些，但是如果女性懷孕的話，那麼這種幾率就會比較低。第二、治療子宮内膜異位症，這種病可能很多人聽起來感覺不是很理解，但是如果患有這種病，而女性在懷孕的時候，那麼這種病就會被強行的遏制，所以女性在懷孕生子，其實對于這種病的治療有非常好的效果，并且沒有任何的副作用。第三 2023-06-29
科技 oppo手機右上角hd怎麼關
1、進入手機窗口找個設置功能圖标，注意右上角的HD，然點擊設置，進入到設置界面，如圖。2、向下滑動設置界面找到電話功能，如圖。3、點擊電話，進入到電話界面，如圖。4、點擊開啟VoLTE通話功能關閉按鈕就可以了，如圖。 2023-06-29
科技如何删除微信視頻評論
1、第一步手機上打開微信，進去視頻号，點擊右上方的圖标。2、第二步進去個人界面之後，點擊我的視頻号。... 2023-06-29
科技小火雞苗怎麼養
1、育雛期。育雛期是指0-8周齡的火雞，育雛室内的溫度和濕度偏高，如果1次喂食較多的飼料，未吃完的飼料會發黴，産生黴變，在喂食雛火雞時，要本着少喂多添”和飼料新鮮”的原則，1天多次投喂适量的飼料。雛火雞的飲用水必須是20℃、清潔衛生的飲水，4-6小時更換1次飲水，以保證雛火雞的飲用水質量。2、育成期。育成期是指9-28周齡的火雞，經過育雛期後，火雞的體質和抗病能力已經較強，一般的溫差變化威脅不大， 2023-06-29
科技蘋果原彩顯示有什麼用
1、iPhone在屏幕顯示中加入原彩顯示技術。2、蘋果原彩顯示是根據環境光線條件自動調成屏幕亮度與色... 2023-06-29
科技蘋果6p怎麼退出耳機模式
1、設置-通用-輔助功能-肢體活動中的來電使用(默認)。2、用iphone的耳機接入接口，打開ipo... 2023-06-29

tft每日頭條

> 科技

> ai算法每月提速多少

ai算法每月提速多少

相关科技资讯推荐

热门科技资讯推荐

网友关注