怎麼看batchsize神經網絡-tft每日頭條

怎麼看batchsize神經網絡

生活更新时间:2026-05-30 07:18:36

　　2018年中的大部分時間，我都在嘗試利用訓練神經網絡克服GPUs的局限。無論是在包含1.5億個參數的語言模型中，比如OpenAI’s huge Generative Pre-trained Transformer (or the recent and similar BERT model)，還是在擁有3000萬個輸入元素的神經網絡中，我都隻能利用GPU處理很少的訓練樣本。

　　可是若想利用随機梯度下降算法得出不錯的結果，大批量的訓練樣本必不可少。

　　如果你的GPU隻能處理少量樣本，該如何訓練大批量模型呢？

　　接下來，我将介紹幾類工具和技巧。

　　本文主要會讨論PyTorch框架，并就以下幾個問題進行探讨：

　　當訓練批量甚至單個訓練樣本大于GPU内存時，如何訓練模型；如何高效地利用多GPU機器；如何在分布式設備上簡單的使用多個機器。 在一個或多個GPU上訓練大批量模型

　　你構建了一個不錯的模型，可在嘗試處理更多樣本時，卻得到CUDA RuntimeError：内存不足。

　　怎麼看batchsize神經網絡（增大Batch訓練神經網絡）(1)

　　根據網友的回答你明白，加倍批量可以對結果進行優化。

　　此時，梯度累積（accumulating gradients）可以幫助到你。

　　怎麼看batchsize神經網絡（增大Batch訓練神經網絡）(2)

　　PyTorch代碼如下所示：

　　predictions = model(inputs) # Forward pass loss = loss_function(predictions, labels) # Compute loss function loss.backward() # Backward pass optimizer.step() # Optimizer step predictions = model(inputs) # Forward pass with new parameters

　　loss.backward()計算出每個參數的梯度，并存儲在parameter.grad中。

　　梯度累積意味着，在調用potimizer.step()實現梯度下降之前，我們會求取parameter.grad張量中的幾個反向操作的梯度和。

　　如下是使用梯度累積訓練模型的示例。

　　model.zero_grad() # Reset gradients tensors for i, (inputs, labels) in enumerate(training_set): predictions = model(inputs) # Forward pass loss = loss_function(predictions, labels) # Compute loss function loss = loss / accumulation_steps # Normalize our loss (if averaged) loss.backward() # Backward pass if (i 1) % accumulation_steps == 0: # Wait for several backward steps optimizer.step() # Now we can do an optimizer step model.zero_grad() # Reset gradients tensors if (i 1) % evaluation_steps == 0: # Evaluate the model when we... evaluate_model() # ...have no gradients accumulated

　　擴展

　　我們甚至可以在GPU上訓練一個連樣本都無法加載得模型，并且可以使用梯度檢查點（gradient-checkpoingting）節省計算資源。

　　梯度檢查點會将我們連續計算的元前饋和元反向傳播切分成片段。但由于需要增加額外的計算以減少内存需求，該方法效率不高。不過，它在某些示例中又有較為明顯的優勢，比如在長序列上訓練RNN模型，點擊此處查看詳情。

　　或有興趣可進入下列文檔進行查詢：

　　TensorFlow：htt第四個步驟（見右上）中，GPU-1彙集了所有并行計算的結果。

　　通過下列所示的方式能夠計算出語言模型輸出的大小：

　　怎麼看batchsize神經網絡（增大Batch訓練神經網絡）(5)

　　Number of elements in the output of a language model

　　現有如下假設：數據集共含4萬詞彙，序列中包含250 tokens，每個batch 包含32個示例，每個元素4 bytes，模型的輸出占用1.2GB。但我們需要2.4GB的内存才能存儲相關的梯度張量。

　　這種存儲方式會使得GPU-1被過度使用，從而造成GPU使用不均衡的問題。

　　多GPU機器上的負載均衡

　　想要解決GPU使用不均衡的問題需要将每部分輸出都保留在原有的GPU上，而不彙集于GPU-1。

　　張航開源了名為PyTorch-Encoding的包，可用于緩解上述問題。

　　我對這個開源包做了一些調整，你可以點擊此處下載parallel.py。此包中包含兩個模塊：DataParallelModel以及DataParallelCriterion，如下所示：

　　from parallel import DataParallelModel, DataParallelCriterion parallel_model = DataParallelModel(model) # Encapsulate the model parallel_loss = DataParallelCriterion(loss_function) # Encapsulate the loss function predictions = parallel_model(inputs) # Parallel forward pass # "predictions" is a tuple of n_gpu tensors loss = parallel_loss(predictions, labels) # Compute loss function in parallel loss.backward() # Backward pass optimizer.step() # Optimizer step predictions = parallel_model(inputs) # Parallel forward pass with new parameters

　　DataParallelModel不同于torch.nn.DataParallel的是，前向傳播的輸出（predictions）沒有彙集在GPU-1中，而是作為n_gup張量的元組分布在相應的GPU上。

　　DataParallelCriterion容器封裝了損失函數，并且将n_gpu張量的元組和目标标簽張量作為輸入。

　　下圖描述了DataParallelModel/DataParallelCriterion的内部情況：

　　下面有兩個特殊情況，并給出了解決辦法：

　　模型輸出了一些張量：你可以利用output_1,output_2 = zip(*predictions)分解它們。若你不想并行計算損失函數，則可以利用gathered_prdictions = parallel.gather(predictions)收集張量。 分布式訓練

　　PyTorch中的DistributedDataParallel可以幫助我們在遇到大批量訓練問題時，擁有控制多個服務器的運算能力。

　　但值得注意的是：由于對每個節點都要啟動一個獨立的Python訓練腳本，在設定時需要注意改變工作流程。

　　每個腳本在訓練中都會擁有：

　　它自己的優化器，在每次叠代中都執行一個完整的優化，不需要參數傳輸。一個獨立的Python解釋器：能夠避免GIL-freeze 在後面我們将通過代碼進行讨論：

　　torch.distributed包能夠為同步分布式運算提供低級原語，基于此構建得到DistributedDataParallel。你可以通過閱讀文檔以及教程對其進行進一步理解。

　　接下來，我們将使用具有兩個4-GPU的服務器。

　　怎麼看batchsize神經網絡（增大Batch訓練神經網絡）(7)

　　The main server (server 1) has an accessible IP and an open port for communication.

　　升級Python腳本以适用分布式訓練

　　首先，我們需要對腳本進行升級，使其能夠獨立的在機器（節點）中運行。我們想要完全實現分布式，并且在每個結點的每個GPU上獨立運行進程，這一共需要8個進程。

　　接下來，初始化分布式後端，封裝模型以及準備數據，這些數據用于在獨立的數據子集中訓練進程。更新後的代碼如下：

　　from torch.utils.data.distributed import DistributedSampler from torch.utils.data import DataLoader # Each process runs on 1 GPU device specified by the local_rank argument. parser = argparse.ArgumentParser() parser.add_argument("--local_rank", type=int) args = parser.parse_args() # Initializes the distributed backend which will take care of sychronizing nodes/GPUs torch.distributed.init_process_group(backend='nccl') # Encapsulate the model on the GPU assigned to the current process device = torch.device('cuda', arg.local_rank) model = model.to(device) distrib_model = torch.nn.parallel.DistributedDataParallel(model, device_ids=[args.local_rank], output_device=args.local_rank) # Restricts data loading to a subset of the dataset exclusive to the current process sampler = DistributedSampler(dataset) dataloader = DataLoader(dataset, sampler=sampler) for inputs, labels in dataloader: predictions = distrib_model(inputs.to(device)) # Forward pass loss = loss_function(predictions, labels.to(device)) # Compute loss function loss.backward() # Backward pass optimizer.step() # Optimizer step

　　為Python腳本加載多個實例

　　現在，我們将在每個服務器上啟動訓練腳本的實例。

　　我們使用PyTorch中的torch.distributed.launch運行腳本。它能用于環境變量的設置，并使用正确的local_rank參數調用腳本。

　　最主要的是第一台機器，所有的機器都要求能對它進行訪問。因此，它需要擁有一個可以訪問的IP地址（示例中為：196.168.1.1）以及一個開放的端口（示例中為：1234）。我們将使用torch.distributed.launch在第一台機器上運行腳本，具體如下：

　　python -m torch.distributed.launch --nproc_per_node=4 --nnodes=2 --node_rank=0 --master_addr="192.168.1.1" --master_port=1234 OUR_TRAINING_SCRIPT.py (--arg1 --arg2 --arg3 and all other arguments of our training script)

　　同樣在第二台機器中運行腳本：

　　python -m torch.distributed.launch --nproc_per_node=4 --nnodes=2 --node_rank=1 --master_addr="192.168.1.1" --master_port=1234 OUR_TRAINING_SCRIPT.py (--arg1 --arg2 --arg3 and all other arguments of our training script)

　　除了—node_rank參數之外，上述兩個命令相同。

　　擴展

　　如果你覺得在計算機集群上運行一組幾乎相同的命令有些枯燥，可點擊此處了解GNU并行。

　　怎麼看batchsize神經網絡（增大Batch訓練神經網絡）(8)

　　以上為譯文

　　本文由阿裡雲雲栖社區組織翻譯。

　　文章原标題《Training Neural Nets on Larger Batches: Practical Tips for 1-GPU, Multi-GPU Distributed setups》，作者：

　　Thomas Wolf，譯者：Elaine，審校：袁虎。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活李飛為什麼不火
最近幾天各大社交媒體重慶闆塊的熱門詞彙總是出現了一個叫李飛的人，許多網友都表達了對他個人的看法。當然有許多都是不怎麼好的觀點。這個叫李飛的人到底是誰？為什麼他這幾天突然在重慶這麼火？今天我們就來為你說說李飛和李飛公司在這幾天幹的事兒。網友對... 2022-11-19
生活小學生必背成語100個
成語是漢語的一大特色，其意思精辟，極富表達力。學習成語不僅能增長知識，更能讓人明白很多道理。今天為大家整理分享100個有趣又好記的成語之最，讓孩子一邊玩一邊學！再也不用擔心孩子覺得成語枯燥不好學，死記硬背還常常記錯！相信，你看完，一定會記憶... 2022-11-19
生活多媒體最簡單的解釋
多媒體最簡單的解釋?1、多媒體的定義“多媒體”是指融合兩種或兩種以上媒體的一種人-機交互式信息交流和傳播技術，這些信息媒體包括：文字、聲音、圖形、圖像、動畫、視頻等，我來為大家科普一下關于多媒體最簡單的解釋?以下内容希望對你有幫助!多媒體最... 2022-11-23
生活月經不調每天都來怎麼辦
月經不調怎麼辦?首先要對月經不調的患者進行檢查，确定導緻月經不調的原因。(一)基本病史及體格檢查(二)輔助檢查：如B超檢查、内分泌測定、宮頸細胞學檢查、内膜活組織檢查、宮腔鏡檢查、X線檢查、子宮碘油造影等，其中，碘油造影檢查能夠分辨子宮有無... 2022-12-01
生活 dnf快速獲得轉職書
DNF2022100級轉職書怎麼獲得？相信大家都想獲得這個強力道具，下面給大家帶來的是DNF100級轉職書獲取途徑詳解，一起來看一看吧，希望可以幫助到大家。DNF100級轉職書獲得攻略1月20日之後将推出異界地下城複刻活動，不過隻能使用固定... 2023-01-21
生活國産路虎suv價位
2020年2月14日，奇瑞路虎官方公布了國産路虎發現運動版車型價格，此次國産路虎發現運動版全系共推出五款車型，其售價區間為35.68萬至45.58萬元，全系車型均搭載2.0升渦輪增壓發動機，并且部分車型配有7座版本。作為國産路虎發現神行的中... 2022-12-23
生活成都紅光廣場最新消息
2021年群光廣場全新升級，璀璨歸來。部類全面大調整，原2樓時尚名品館女鞋部類全部移至3樓名媛麗人館；原5樓紳士服飾館紳士男裝整合上7樓紳士童樂館；現5樓更名為潮流酷玩館，集潮流品牌在一起。1樓化妝品引進全新品牌群（香奈兒、愛馬仕、海藍之謎... 2023-01-19
生活亞馬遜一件代發貨源在哪裡找
跨境電商運營的成敗，産品往往占着舉足輕重的作用，對于亞馬遜的運營來說更是如此。可以這麼說，産品好，運營一般也不會太差，但産品差，運營也不會太好。很多跨境電商賣家的困境恰恰是，既沒有選品的方向，更沒有選品的資源，如此之下，談産品好壞就顯得有點... 2022-12-15
生活時間簡史的讀後感1000
從識字以來，我讀過很多書：《西遊記》《俄羅斯童話》《上下五千年》……然而，現在五年級的我有些不滿足于這些書了，開始對《前世今生》《時間簡史》一類講述哲理、科學的書興趣盎然。雖然初看上去，這些書枯燥無味，但是細細品味，卻常常引發我無限的思考與... 2022-11-18
生活失落神殿魔窟攻略
作者：NGA-阿布evo概述該任務→常規任務的最後一個就能打開，夢幻萬花宮(不知道有沒有限制…？)。基本玩法就是選一個角色，利用裡面撿到的物品武裝自己/提升等級，然後深入50層。角色在迷宮裡的強度和玩家自身的練度無關，無論是聖城建築、武器加... 2022-11-30
生活什麼車能對比路虎衛士
封面新聞記者李繼龍6月16日，全新路虎衛士在北京完成了中國首秀，并開啟110車型預售，預售價格區間為79-99萬元。用不到大G一半的價格買同樣純正的全新衛士，你會怎麼選？同時，路虎還專為中國消費者提供限量30台的首發啞銀特别套件版：其中27... 2022-11-11
生活 2023春節放假安排日
2023年新年放假時間為2023年1月22日（農曆正月初一）開始放假，到2023年1月28日（農曆正月初七）假期結束, 2023-01-26
生活龍擡頭有哪些節日風俗
二月二日新雨晴，草芽菜甲一時生。輕衫細馬春年少，十字津頭一字行。春節和元宵節的喜慶還餘味未散，轉眼就是“二月二”了。二月初二龍擡頭，是中國民間的傳統節日，又叫"春耕節"、"農事節"、"春龍節"... 2022-11-30
生活 word文檔長什麼樣
word文檔長什麼樣?Word是微軟公司的一個文字處理器應用程序，可以使用Word處理文字内容，進行版面編輯等操作，下面我們就來聊聊關于word文檔長什麼樣?接下來我們就一起去了解一下吧!word文檔長什麼樣Word是微軟公司的一個文字處理... 2022-06-15
生活口腔護理用得最多的産品
國人在口腔健康方面意識相對薄弱，一般隻了解牙刷這一口腔清潔工具。今天，牙超人帶大家認識幾件來自島國的高逼格口腔護理産品，它們不隻是設計獨具特色，有的還自帶黑科技，一起來看看。（1）Ci刮舌器總是厭煩自己的口臭？想要徹底趕走難聞異味，當個口氣... 2023-02-11
生活心房顫動需要做什麼檢查
房顫又稱心房顫動，是一種常見的心律失常。患者常因心悸胸悶等來院就診，通過心電圖檢查而發現。房顫是心房肌不規則的收縮，聽診時心率有快有慢，心律絕對不規則，心音強弱不一緻，心室率慢于心房率，脈率又低于心室率，脈搏出現“短绌”現象。簡單點說就是，... 2023-01-21
生活青羊區剛需新樓盤
概覽在成都青羊，目前最炙手可熱的名校盤是哪幾個？幸福裡為你找到了青羊最近一天關注度最高的近名校小區。分别為：康樂園、尊城國際、光華馨地、博瑞都市花園、恒大翡翠華庭。位于草堂的清江東路39号院最新均價為16296元/平，為昨日的熱度冠軍。該小... 2023-02-24
生活 excel中if函數有五個等級如何使...
IF函數——根據條件判斷真假IF函數的作用是對指定的條件執行真假值判斷，根據邏輯測試的真假值，計算或返回不同的結果。用戶可以使用IF函數對數值和公式進行條件檢測，也可以嵌套使用IF函數。語法結構：IF(logical_test,value_... 2023-02-05
生活男怕新鮮女怕愁是什麼意思
俗話說的“男怕夜奔，女怕思凡”是什麼意思？演藝界的人常愛說“男怕夜奔，女怕思凡”，背後有什麼隐情嗎？民間俗語都是人生經驗的提煉與升華，所以，出語往往形象鮮明、言簡意赅，且發人深思。比如“冷莫靠燈，窮莫投親”、“富人妻，牆上皮；窮人妻，心肝肺... 2023-01-04
生活這個版本的小豬佩奇你看過嗎
最近，我發現了一件很奇特的事，我最愛的佩奇，居然鋪天蓋地地成為了明星。随處可見的街拍……紋身……當自己的個人私好，突然成為了社會流行，這是一件很奇怪的事。百感交集。我在奶娃的時候就開始看小豬佩奇。月子裡那種随時想把娃扔下床的狂躁心情，居然被... 2022-12-25
生活嘎嘣脆蘿蔔的腌制方法
嘎嘣脆蘿蔔的腌制方法?準備食材：白蘿蔔1000克、大蒜适量、辣椒适量、味極鮮醬油300克、老陳醋300克、白糖150克，我來為大家講解一下關于嘎嘣脆蘿蔔的腌制方法?跟着小編一起來看一看吧!嘎嘣脆蘿蔔的腌制方法準備食材：白蘿蔔1000克、大蒜... 2022-07-26
生活這5個動作幫你瘦手臂
夏天到了，小姐妹們是不是都想穿上漂亮的小吊帶呢？但是手臂的拜拜肉可能影響穿上吊帶的效果。别慌！給大家準備了4個動作，堅持練，就能快速瘦手臂，和拜拜肉說“拜拜”哦！1四柱支撐：這個動作身體要保持一條直線，大小臂垂直，腳後跟要用力向後路。2下犬... 2022-10-30
生活七夕情人節文案高質量句子
011.世界的溫柔，是晚來的善意和幹淨的你。2.長日欣喜，四季予你。3.人間有風，有雨，有陽光，還有一個不錯的你。4.你是我遇見的所有美好裡的剛剛好。5.平穩而不平淡，快樂而長久。6.情不知所起，一往而深。7.沒有特别的愛好，除了錢就是你。... 2022-12-06
生活我以為我什麼都不說你會懂
我以為我什麼都不說你會懂?我以為我什麼都是小學時，我們會玩石子遊戲，我們爬的了樹，我們在水裡憋氣，我們可以不喘氣遊好幾次來回，我們可以踩着滑輪就這樣義無反顧往前滑，我們可以就這樣和夥伴們在操場跑好幾個來回，我們完成一個又一個手工作品，我們可... 2023-01-04
生活泡黑豆酒配方大全
泡黑豆酒配方大全?配方一配方：黑大豆500克，米酒3000毫升，下面我們就來說一說關于泡黑豆酒配方大全?我們一起去了解并探讨一下這個問題吧!泡黑豆酒配方大全配方一配方：黑大豆500克，米酒3000毫升。配方二配方：黑豆250克，白芷30克，... 2022-06-13
生活小米夜晚人臉識别
上周很夜了，妹子居然還打電話給我，剛接通就聽到她聲音在抖：“我點了個外賣，有人敲門了，開門發現什麼都沒有！“丢外賣、快遞都是小事，因為太多恐怖百倍的新聞了：現在好多朋友剛出來工作，都是單身租房。房東為了省錢，好多房子連貓眼都給省了。你根本不... 2023-01-10
生活國内金價高于國際金價
由于國際金價和内地金價的價差太大，預計到今年年底，中國黃金進口量可能會維持在200噸以下。中國内地自香港的黃金進口量從8月份的1.2噸躍升至9月份的11.1噸，為今年以來月度第二高水平。然而，由于來自瑞士和新加坡的進口量大幅下降，9月份總淨... 2023-03-09
生活廚房窗簾清洗妙招
廚房窗簾清洗妙招?紗窗清洗小妙招之一：我們先将紗窗取下來，然後用沾有洗潔精的抹布用力的擦拭，或者将其平放在衛生間的地上用刷子刷洗，等把紗窗都挨個擦拭了一遍之後，我們就用花灑或者活動水龍頭進行沖洗，直到認為幹淨了為止，最後将其放在通風處晾幹即... 2022-06-09
生活雲南麗江旅遊四日遊攻略
今天小編分享一個麗江、泸沽湖、香格裡拉9日遊的自由行攻略，喜歡背包自由行的朋友拿着它就可以出行了。D1、北京T2——昆明長水機場，早班航班8:05——11:55。長水機場——昆明南站，919K線大巴，票價13元，大約一個半小時。打車80——... 2023-01-24
生活白鲳魚有什麼營養價值
白鲳魚有什麼營養價值?白鲳魚的營養價值在于含有豐富的優質蛋白質以及不飽和脂肪酸，它的食療功效具有益氣養血、補胃益精、滑利關節，對于消化不良、脾胃虛弱、貧血的患者有特殊的功效優質蛋白質在人體内可以增強人的免疫功能，來改善機體的抗病能力，不飽和... 2022-06-02

tft每日頭條

> 生活

> 怎麼看batchsize神經網絡

怎麼看batchsize神經網絡

相关生活资讯推荐

热门生活资讯推荐

网友关注