tft每日頭條

 > 科技

 > 服務器cpu跟gpu匹配關系

服務器cpu跟gpu匹配關系

科技 更新时间:2025-01-31 20:12:38

一、什麼是CPU?什麼是GPU?在搞清楚GPU服務器和CPU服務器的區别之前,我們先回憶下,什麼是CPU?什麼是GPU?1、所謂CPU即中央處理器(CPU,central processing unit,縮寫:CPU),是作為整個計算機系統的運算和控制的核心,是信息處理、程序運行的最終執行單元。CPU是最核心的部件,也是整個數據處理的最根本的部件。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)1

最新第四代霄龍服務器級CPU

2、所謂GPU即圖形處理器(GPU,Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、遊戲機和一些移動設備(如平闆電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。

但是,僅僅從上面的字面含義,是不能正确了解GPU和CPU在數據計算中的扮演的重要角色。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)2

GPU 與 與 CPU區别:

從 GPU 與 CPU 架構對比圖可以看出,CPU 的邏輯運算單元較少,控制器占比較大;GPU 的邏輯運算單元小而多,控制器功能簡單,緩存也較少。GPU 的衆多邏輯運算單元呈矩陣排列,可以并行處理數量衆多但較為簡單的處理任務,圖像運算處理就可以進行這樣的拆解。GPU 單個運算單元處理能力弱于 CPU,但是數量衆多的運算單元可以同時工作,當面對高強度并行計算時,其性能要優于 CPU。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)3

簡而言之

CPU擅長道統領全局等複雜操作而GPU擅長對大數據進行簡單重複操作。CPU是從事複雜腦力勞動版的教援,而GPU是進行大量并行計算的體力勞動者。

深度學習是模拟人腦神經系統而建立的數學網絡模型,這個模型的最大特點是,需要大數據來訓練。因此,對電腦處理器的權要求,就是需要大量的并行的重複計算,GPU正好有這個專長。這也是GPU服務器如今如火如荼的重要原因。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)4

二、CPU服務器和GPU服務器之間的區别

CPU服務器和GPU服務器的說法,其實也不科學。沒有GPU的服務器,照樣可以進行計算和使用,但沒有CPU的服務器是無法工作的。簡單的說,CPU服務器和GPU服務器的說法隻是偏重于該服務器的側重點不同而已。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)5

三、GPU服務器

GPU服務器是基于GPU的應用于視頻編解碼、深度學習、科學計算等多種場景的快速、穩定、彈性的計算服務,我們提供和标準雲服務器一緻的管理方式。出色的圖形處理能力和高性能計算能力提供極緻計算性能,有效解放計算壓力,提升産品的計算處理效率與競争力。

四、如何選擇GPU服務器,GPU服務器的選擇原則:

首先,我們需要了解下,GPU主要分三種接口,目前市面上可以進行交付的主要是傳統總線接口、PCIe接口和NV-Link接口的。

NV-Link接口類型的GPU典型代表是NVIDIA V100,采用 SXM2接口。在DGX-2上有SXM3的接口。NV-Link總線标準的GPU服務器可以分為兩類,一類是NVIDIA公司設計的DGX超級計算機,另一類是合作夥伴設計的NV-Link接口的服務器。DGX超級計算機不僅僅提供硬件,還有相關的軟件和服務。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)6

傳統總線接口的GPU,目前主流的有這幾款産品,比如 PCI-e接口的V100、 P40(P開頭指的是上一代PASCAL架構)和P4,以及最新的圖靈架構T4等。其中比較薄和隻占一個槽位的P4和T4,通常用于Inference,目前也已經有成熟的模型進行推理和識别。

傳統PCI-e總線的GPU服務器也分為兩類,一類是OEM服務器,比如曙光、浪潮、華為等其他國際品牌;另一類是非OEM的服務器,也包括很多種類。選擇服務器時除了分類,還要考慮性能指标,比如精度、顯存類型、顯存容量以及功耗等,同時也會有一些服務器是需要水冷、降噪或者對溫度、移動性等等方面有特殊的要求,就需要特殊的服務器。

選擇GPU服務器時首先要考慮業務需求來選擇适合的GPU型号。在HPC高性能計算中還需要根據精度來選擇,比如有的高性能計算需要雙精度,這時如果使用A40、RTX4090或者RTX A6000就不合适,隻能使用A100、A800或者H100;同時也會對顯存容量有要求,比如石油或石化勘探類的計算應用對顯存要求比較高;還有些對總線标準有要求,因此選擇GPU型号要先看業務需求。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)7

GPU服務器人工智能領域的應用也比較多。在教學場景中,對GPU虛拟化的要求比較高。根據課堂人數,一個老師可能需要将GPU服務器虛拟出30甚至60個虛拟GPU,因此批量Training對GPU要求比較高,通常用V100做GPU的訓練。模型訓練完之後需要進行推理,因此推理一般會使用P4或者T4,少部分情況也會用V100。

當GPU型号選定後,再考慮用什麼樣GPU的服務器。這時我們需要考慮以下幾種情況:

第一、 在邊緣服務器上需要根據量來選擇T4或者P4等相應的服務器,同時也要考慮服務器的使用場景,比如火車站卡口、機場卡口或者公安卡口等;在中心端做Inference時可能需要V100的服務器,需要考慮吞吐量以及使用場景、數量等。

第二、 需要考慮客戶本身使用人群和IT運維能力,對于BAT這類大公司來說,他們自己的運營能力比較強,這時會選擇通用的PCI-e服務器;而對于一些IT運維能力不那麼強的客戶,他們更關注數字以及數據标注等,我們稱這類人為數據科學家,選擇GPU服務器的标準也會有所不同。

第三、 需要考慮配套軟件和服務的價值。

第四、 要考慮整體GPU集群系統的成熟程度以及工程效率,比如像DGX這種GPU一體化的超級計算機,它有非常成熟的從底端的操作系統驅動Docker到其他部分都是固定且優化過的,這時效率就比較高。

服務器cpu跟gpu匹配關系(GPU服務器和普通服務器有什麼區别)8

上海風虎信息-高性能計算軟硬件供應商

本文轉自知乎賣服務器的小天,出藍色字體部分稍作修改,與時俱進,圖片為後配,其餘無修改,如有商用、轉載需要請聯系原作者。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved