tft每日頭條

 > 科技

 > 顯卡核心架構

顯卡核心架構

科技 更新时间:2024-08-07 15:09:18
什麼是顯卡?

顯卡是系統必備的裝置,它負責将CPU送來的影像資料(data)處理成顯示器(monitor)可以了解的格式,再送到顯示屏(screen)上形成影像。它是我們從電腦獲取資訊最重要的管道。因此顯示卡及顯示器是電腦最重要的部份之一。

顯卡核心架構(搞人工智能先挑選顯卡)1

磐鐳GTX1070 8G顯卡

顯卡的基本原理

顯卡的主要部件是:主闆連接設備、監視器連接設備、處理器和内存。不同顯卡的工作原理基本相同CPU與軟件應用程序協同工作,以便将有關圖像的信息發送到顯卡。顯卡決定如何使用屏幕上的像素來生成圖像。之後,它通過線纜将這些信息發送到監視器。

顯卡的最低标準是視頻圖形陣列(VGA),它能顯示256種顔色。通過像量子擴展圖矩陣(QuantumExtendedGraphicsArray,QXGA)這樣的高性能标準,顯卡可以在最高達2040x1536像素的分辨率下顯示數百萬種顔色。根據二進制數據生成圖像是一個很費力的過程。為了生成三維圖像,顯卡首先要用直線創建一個線框。然後,它對圖像進行光栅化處理(填充剩餘的像素)。此外,顯卡還需添加明暗光線、紋理和顔色。對于快節奏的遊戲,電腦每秒鐘必須執行此過程約60次。如果沒有顯卡來執行必要的計算,則電腦将無法承擔如此大的工作負荷。

顯卡工作的四個主要部件

顯卡在完成工作的時候主要靠四個部件協調來完成工作,主闆連接設備,用于傳輸數據和供電,處理器用于決定如何處理屏幕上的每個像素,内存用于存放有關每個像素的信息以及暫時存儲已完成的圖像,監視器連接設備便于我們查看最終結果。

處理器和内存

像主闆一樣,顯卡也是裝有處理器和RAM的印刷電路闆。此外,它還具有輸入/輸出系統(BIOS)芯片,該芯片用于存儲顯卡的設置以及在啟動時對内存、輸入和輸出執行診斷。顯卡的處理器稱為圖形處理單元(GPU),它與電腦的CPU類似。但是,GPU是專為執行複雜的數學和幾何計算而設計的,這些計算是圖形渲染所必需的。某些最快速的GPU所具有的晶體管數甚至超過了普通CPU。GPU會産生大量熱量,所以它的上方通常安裝有散熱器或風扇。

除了其處理能力以外,GPU還使用特殊的程序設計來幫助自己分析和使用數據。市場上的絕大多數GPU都是AMD和NV生産的,并且這兩家公司都開發出了自己的GPU性能增強功能。為了提高圖像質量,這些處理器使用全景抗鋸齒技術,它能讓三維物體的邊緣變得平滑,以及各向異性過濾,它能使圖像看上去更加鮮明。

通常,顯卡RAM以非常高的速度運行,且采取雙端口設計,這意味着系統可以同時對其進行讀取和寫入操作。RAM直接連接到數模轉換器,即DAC。這個轉換器也稱為RAMDAC,用于将圖像轉換成監視器可以使用的模拟信号。有些顯卡具有多個RAMDAC,這可以提高性能及支持多台監視器。

顯卡輸入和輸出

ADC連接器蘋果公司曾經制造過使用專利産品AppleDisplayConnector(ADC)的監視器。盡管這些監視器目前仍在使用,但蘋果公司新出的監視器已改為使用DVI連接設備。顯卡通過主闆連接到電腦主闆為顯卡供電,并使其可以與CPU通信。對于較高端的顯卡,主闆所提供的電能往往不足,所以顯卡還直接連接到電腦的電源。

顯卡與主闆的連接通常是借助外設部件互連(PCI)、高級圖形端口(AGP)、PCIExpress(PCIe)等三種接口接口來實現的,在這三種接口中,PCIExpress是最新型的接口,它能在顯卡和主闆之間提供最快的傳輸速率。此外,PCIe還支持在一台電腦中使用兩塊顯卡。

影響顯卡速度和效率的因素

DirectX和OpenGLDirectX和OpenGL都是應用程序編程接口,簡稱API。API提供用于複雜任務的指令,以此幫助軟硬件更高效地通信。開發人員針對特定的API來優化大量使用圖形的遊戲。這就是最新的遊戲通常需要DirectX或OpenGL的更新版才能正确運行的原因。

API不同于驅動程序。驅動程序是使硬件可以與電腦的操作系統進行通信的程序。但如同更新版的API一樣,更新版的設備驅動程序可以幫助程序正确運行。

如何衡量顯卡好壞?

頂級顯卡很容易辨認,它應該具有大量内存和速度很快的處理器。此外,與其他任何要安裝到電腦機箱中的部件相比,它通常是最令人關注的。很多高性能顯卡都配備了散熱器。

顯卡核心架構(搞人工智能先挑選顯卡)2

磐鐳GTX1070的顯卡散熱器

但高端顯卡提供的功能超出了大多數人的真實需要。對于主要使用電腦來收發電子郵件、從事文字處理或上網沖浪的用戶來說,帶有集成顯卡的主闆便能夠提供所有必要的圖形功能。對于大多數偶爾玩遊戲的用戶來說,中端顯卡已經足以滿足需要。隻有遊戲迷和那些需要完成大量三維圖形工作的用戶才需要高端顯卡。

顯卡性能的一個很好的整體衡量标準是它的幀速,它是以每秒的幀數(FPS)為單位加以衡量的。幀速說明了顯卡每秒鐘能顯示多少幅完整的圖像。人眼的處理能力約為每秒25幀,而動感快速的遊戲至少需要60FPS的幀速才能提供平滑的動畫和滾動。影響幀速的因素包括:每秒生成的三角形數或頂點數三維圖像是由三角形或多邊形組成的。這項指标說明了GPU能夠以多快的速度計算整個多邊形或對該多邊形進行定義的頂點。一般而言,它說明了顯卡能以多快的速度生成線框圖像。

像素填充速率:這項指标說明了GPU一秒鐘内能處理多少個像素,從而也就說明了顯卡能以多快的速度對圖像進行光栅化處理。顯卡的硬件對其速度具有直接影響。以下是對顯卡速度影響最大的硬件性能指标及其衡量單位:GPU時鐘速度(MHz)、内存總線的容量(位)、可用内存的數量(MB)、内存時鐘速率(MHz)内存帶寬(GB/s)、RAMDAC速度(MHz)。

電腦的CPU和主闆也對顯卡速度有一定影響,因為非常快速的顯卡并不能彌補主闆在快速傳輸數據方面的能力的不足。同樣,顯卡與主闆之間的連接以及它從CPU獲取指令的速度都會影響其性能。

超頻有些用戶選擇将自己顯卡的時鐘速度手動設置為更高的速率,以此來提高顯卡的性能,這稱為超頻。人們通常選擇對顯卡的内存進行超頻,因為對GPU進行超頻可能會導緻過熱。雖然超頻可以獲得更好的性能,但它也會使制造商的質保失效。

顯卡主要參數術語解釋:

顯示芯片

又稱圖型處理器-GPU,它在顯卡中的作用,就如同CPU在電腦中的作用一樣。更直接的比喻就是大腦在人身體裡的作用。GPU使顯卡減少了對CPU的依賴,并進行部分原本CPU的工作,尤其是在3D圖形處理時。GPU所采用的核心技術有硬件T&L(幾何轉換和光照處理)、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬件T&L技術可以說是GPU的标志。GPU的生産主要由nVidia與ATI兩家廠商生産。

開發代号

所謂開發代号就是顯示芯片制造商為了便于顯示芯片在設計、生産、銷售方面的管理和驅動架構的統一而對一個系列的顯示芯片給出的相應的基本的代号。開發代号作用是降低顯示芯片制造商的成本、豐富産品線以及實現驅動程序的統一。

一般來說,顯示芯片制造商可以利用一個基本開發代号再通過控制渲染管線數量、頂點着色單元數量、顯存類型、顯存位寬、核心和顯存頻率、所支持的技術特性等方面來衍生出一系列的顯示芯片來滿足不同的性能、價格、市場等不同的定位,還可以把制造過程中具有部分瑕疵的高端顯示芯片産品通過屏蔽管線等方法處理成為完全合格的相應低端的顯示芯片産品出售,從而大幅度降低設計和制造的難度和成本,豐富自己的産品線。同一種開發代号的顯示芯片可以使用相同的驅動程序,這為顯示芯片制造商編寫驅動程序以及消費者使用顯卡都提供了方便。

制造工藝

制造工藝指得是在生産GPU過程中,要進行加工各種電路和電子元件,制造導線連接各個元器件。通常其生産的精度以nm(納米)來表示(1mm=1000000nm),精度越高,生産工藝越先進。在同樣的材料中可以制造更多的電子元件,連接線也越細,提高芯片的集成度,芯片的功耗也越小。

微電子技術的發展與進步,主要是靠工藝技術的不斷改進,使得器件的特征尺寸不斷縮小,從而集成度不斷提高,功耗降低,器件性能得到提高。芯片制造工藝在1995年以後,從0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米、0.09微米,再到主流的65納米、55納米、40納米。

核心頻率

顯卡的核心頻率是指顯示核心的工作頻率,其工作頻率在一定程度上可以反映出顯示核心的性能,但顯卡的性能是由核心頻率、流處理器單元、顯存頻率、顯存位寬等等多方面的情況所決定的,因此在顯示核心不同的情況下,核心頻率高并不代表此顯卡性能強勁。比如GTS250的核心頻率達到了750MHz,要比GTX260 的576MHz高,但在性能上GTX260 絕對要強于GTS250。在同樣級别的芯片中,核心頻率高的則性能要強一些,提高核心頻率就是顯卡超頻的方法之一。

顯卡BIOS

顯卡BIOS主要用于存放顯示芯片與驅動程序之間的控制程序,另外還存有顯示卡的型号、規格、生産廠家及出廠時間等信息。打開計算機時,通過顯示BIOS内的一段控制程序,将這些信息反饋到屏幕上。早期顯示BIOS是固化在ROM中的,不可以修改,而多數顯示卡則采用了大容量的EPROM,即所謂的FlashBIOS,可以通過專用的程序進行改寫或升級。

顯存

顯示内存的簡稱。顧名思義,其主要功能就是暫時将儲存顯示芯片要處理的數據和處理完畢的數據。圖形核心的性能愈強,需要的顯存也就越多。以前的顯存主要是SDR的,容量也不大。市面上的顯卡大部分采用的是GDDR3顯存,現在最新的顯卡則采用了性能更為出色的GDDR4或GDDR5顯存。顯存主要由傳統的内存制造商提供,比如三星、現代、Kingston等。顯卡上采用的顯存類型主要有SDRDDRSDRAM,DDRSGRAM、DDR2、DDR3、DDR4、DDR5。

DDRSGRAM是顯卡廠商特别針對繪圖者需求,為了加強圖形的存取處理以及繪圖控制效率,從同步動态随機存取内存(SDRAM)所改良而得的産品。SGRAM允許以方塊(Blocks)為單位個别修改或者存取内存中的資料,它能夠與中央處理器(CPU)同步工作,可以減少内存讀取次數,增加繪圖控制器的效率,盡管它穩定性不錯,而且性能表現也很好,但是它的超頻性能很差。

顯存位寬

顯存位寬是顯存在一個時鐘周期内所能傳送數據的位數,位數越大則瞬間所能傳輸的數據量越大,這是顯存的重要參數之一。顯存位寬越高,性能越好價格也就越高。

顯存帶寬=顯存頻率X顯存位寬/8,在顯存頻率相當的情況下,顯存位寬将決定顯存帶寬的大小。顯卡的顯存是由一塊塊的顯存芯片構成的,顯存總位寬同樣也是由顯存顆粒的位寬組成。顯存位寬=顯存顆粒位寬×顯存顆粒數。顯存顆粒上都帶有相關廠家的内存編号,可以去網上查找其編号,就能了解其位寬,再乘以顯存顆粒數,就能得到顯卡的位寬。

顯存速度

顯存速度一般以ns(納秒)為單位。常見的顯存速度有1.2ns、1.0ns、0.8ns等,越小表示速度越快、越好。顯存的理論工作頻率計算公式是:等效工作頻率(MHz)=1000/(顯存速度×n)(n因顯存類型不同而不同,如果是GDDR3顯存則n=2;GDDR5顯存則n=4)。

顯存頻率

顯存頻率一定程度上反應着該顯存的速度,以MHz(兆赫茲)為單位,顯存頻率随着顯存的類型、性能的不同而不同;DDRSDRAM顯存則能提供較高的顯存頻率,因此是采用最為廣泛的顯存類型,無論中、低端顯卡,還是高端顯卡大部分都采用DDRSDRAM,其所能提供的顯存頻率也差異很大,主要有400MHz、500MHz、600MHz、650MHz等,高端産品中還有800MHz或900MHz,乃至更高。

流處理器單元

在DX10顯卡出來以前,并沒有“流處理器”這個說法。GPU内部由“管線”構成,分為像素管線和頂點管線,它們的數目是固定的。

人們在DX10時代首次提出了“統一渲染架構”,顯卡取消了傳統的“像素管線”和“頂點管線”,統一改為流處理器單元,它既可以進行頂點運算也可以進行像素運算,這樣在不同的場景中,顯卡就可以動态地分配進行定點運算和像素運算的流處理器數量,達到資源的充分利用;現在,流處理器的數量的多少已經成為了決定顯卡性能高低的一個很重要的指标,Nvidia和AMD-ATI也在不斷地增加顯卡的流處理器數量使顯卡的性能達到跳躍式增長,值得一提的是,N卡和A卡GPU架構并不一樣,對于流處理器數的分配也不一樣。

顯卡核心架構(搞人工智能先挑選顯卡)3

顯卡參數

雙卡技術

SLI和CrossFire分别是Nvidia和ATI兩家的雙卡或多卡互連工作組模式.其本質是差不多的.隻是叫法不同,SLIScanLineInterlace(掃描線交錯)技術是3dfx公司應用于Voodoo上的技術,它通過把2塊Voodoo卡用SLI線物理連接起來,工作的時候一塊Voodoo卡負責渲染屏幕奇數行掃描,另一塊負責渲染偶數行掃描,從而達到将兩塊顯卡“連接”在一起獲得“雙倍”的性能。

DirectX

DirectX并不是一個單純的圖形API,它是由微軟公司開發的用途廣泛的API,它包含有DirectGraphics(Direct3D DirectDraw)、DirectInput、DirectPlay、DirectSound、DirectShow、DirectSetup、DirectMediaObjects等多個組件,它提供了一整套的多媒體接口方案。隻是其在3D圖形方面的優秀表現,讓它的其它方面顯得暗淡無光。DirectX開發之初是為了彌補Windows3.1系統對圖形、聲音處理能力的不足,已發展成為對整個多媒體系統的各個方面都有決定性影響的接口,最新版本為DirectX11。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved