早期内存通過存儲器總線和北橋相連,北橋通過前端總線與CPU通信。從Intel Nehalem起,北橋被集成到CPU内部,内存直接通過存儲器總線和CPU相連。
所以,在AMD采用Socket FM1,Intel采用LGA 1156插槽之後的處理器都集成了北橋,獨立的北橋已經消失,主闆上僅餘下南橋。
計算機體系的主要矛盾在于CPU太快了,而磁盤太慢了。所以它倆是不能夠直接通信的,需要增加一個過渡層,這就是内存的作用。哈佛結構是一種将程序指令存儲和數據存儲分開的存儲器結構。
内存(Memory)也被稱為内存儲器,其作用是用于暫時存放CPU中的運算數據,以及與硬盤等外部存儲器交換的數據。計算機中所有程序的運行都是在内存中進行的,因此内存的性能對計算機的影響非常大。
1996年底,SDRAM開始在系統中出現,不同于早期的技術,SDRAM的出現是為了與CPU的計時同步化所設計。
SDRAM亦可稱為SDR SDRAM(Single Data Rate SDRAM),Single Data Rate為單倍數據傳輸率,SDR SDRAM的核心、I/O、等效時脈皆相同, SDR SDRAM在1個周期内隻能讀寫1次,若需要同時寫入與讀取,必須等到先前的指令執行完畢,才能接着存取。
DDR SDRAM為雙通道同步動态随機存取内存,是新一代的SDRAM技術。别于SDR(Single Data Rate)單一周期内隻能讀寫1次,DDR的雙倍數據傳輸率指的就是單一周期内可讀取或寫入2次。在核心頻率不變的情況下,傳輸效率為SDR SDRAM的2倍。
總結:DDR采用時鐘脈沖上升、下降沿各傳一次數據,1個時鐘信号可以傳輸2倍于SDRAM的數據,所以又稱為雙倍速率SDRAM。它的倍增系數就是2。
DDR2 SDRAM為雙通道兩次同步動态随機存取記憶體。DDR2内存Prefetch又再度提升至4bit(DDR的兩倍),DDR2的I/O時脈是DDR的2倍。
總結:DDR2仍然采用時鐘脈沖上升、下降時各傳一次數據的技術(不是傳2次),但是一次預讀4bit數據,是DDR一次預讀2bit的2倍,因此,它的倍增系數是2X2=4。
DDR3SDRAM為雙通道三次同步動态随機存取記憶體。DDR3記憶體Prefetch提升至8bit,即每次會存取8 bits為一組的數據。DDR3傳輸速率介于800~1600 MT/s之間。
此外,DDR3 的規格要求将電壓控制在1.5V,較DDR2的1.8V更為省電。DDR3也新增ASR (Automatic Self-Refresh)、SRT(Self-Refresh Temperature)等兩種功能,讓内存在休眠時也能夠随着溫度變化去控制對内存顆粒的充電頻率,确保系統數據完整性。
總結:DDR3作為DDR2的升級版,最重要的改變是一次預讀8bit,是DDR2的2倍,DDR的4倍,所以,它的倍增系數是2*2*2=8。
DDR4 SDRAM提供比DDR3/DDR2更低的供電電壓1.2V以及更高的頻寬。DDR4 新增了4 個Bank Group 組的設計,各個Bank Group具備獨立啟動操作讀、寫等動作特性,Bank Group 組可套用多工的觀念來想像,亦可解釋為DDR4 在同一時脈工作周期内,至多可以處理4 組數據,效率明顯好過于DDR3。
另外,DDR4增加了DBI(Data BusInversion)、CRC(Cyclic Redundancy Check)、CA parity等功能,讓DDR4内存在更快速與更省電的同時亦能夠增強信号的完整性和儲存的可靠性。
Intel在2017年推出對應于六代酷睿Skylake的服務器平台“Purley”,采用14nm工藝、最多28核心56線程、6通道DDR4内存、光纖互連通道,采用UPI總線替代QPI總線等等。UPI是 UltraPath Interconnect(超級通道互連)縮寫,數據傳輸率可達9.6GT/s、10.4GT/s,帶寬更足,靈活性更強,每條消息可以發送多個請求。
内存未來三大演進方向分别為容量、電壓和頻率。
主流内存生産廠家分為内存顆粒廠商和模組廠商,三大内存顆粒(DRAM)原廠依次為Samsung、SK Hynix和Micron。模組廠商Ramaxel和Kingston通過從顆粒廠商購買顆粒制作内存條(DIMM)。
内存有三種不同的頻率指标,它們分别是核心頻率、時鐘頻率和有效數據傳輸頻率。
系統最大内存帶寬 = 内存标稱頻率*内存總線位數*通道數*CPU個數
實際内存帶寬 = 内存标稱頻率*内存總線位數*實際使用的通道數
實際内存帶=内存核心頻率*内存總線位數*實際使用的通道數*倍增系數。
從SDRAM-DDR時代,數據總線位寬時鐘沒有改變,都為64bit,但若是采用雙通道技術,可以獲得64*2=128bit的位寬。
下面計算一條标稱DDR31066的内存條在默認頻率下的帶寬,1066是指有效數據傳輸頻率,除以8才是核心頻率,一條内存隻用采用單通道模式,位寬為64bit。所以,實際内存帶寬=(1066/8)*64*1*8=68224Mbit。
由此可知,如果内存工作在标稱頻率的時候,可以直接用标稱頻率*位寬*實際使用的通道數,簡化公式=1066*64*1=68224Mbit。
如果說内存帶寬是處理器與内存交換數據的關鍵,那麼顯存帶寬對顯卡同樣也很重要。GPU核心負責運算,顯存負責數據存儲,二者之間需要頻繁交換數據,這就要依賴顯存帶寬了,更高的帶寬可以讓顯卡在處理高分辨率、高畫質時更加得心應手。
顯存帶寬從大的方面來說是顯存頻率及顯存位寬來決定的,不過實際帶寬就要看具體情況了,目前主流顯卡的位寬多是128bit、256bit、384bit及512bit,更能決定帶寬的還是顯存類型,它們決定了顯存帶寬的極限。
目前最主流的顯存當然是GDDR5,之前還有過昙花一現的GDDR4,現在低端市場上還有gDDR3顯存殘存,AMD在其顯卡上使用了HBM顯存,相比GDDR5顯存更強大,帶寬大幅提升。
就這二者來說,GDDR5内部I/O帶寬是32bit,目前的NVIDIA顯卡的GDDR5顯存頻率可以達到1750MHz,它是4倍速率機制,數據頻率是7Gbps,單個芯片的帶寬是28GB/s。目前的HBM顯存的頻率隻有500MHz,2倍頻率率機制,數據頻率是1Gbps,不過它的I/O帶寬極高,彌補了頻率不足。
GDDR5和HBM顯存是目前最主流的顯存技術。目前gDDR3顯存基本上是NVIDIA及AMD部分低端顯卡在用。GDDR5絕對是目前的主流,單顆芯片的容量逐漸從之前的2Gb提高到4Gb,美光前不久還量産出貨了8Gb(1GB)顆粒的,高端顯卡也隻要4-8顆芯片即可實現4-8GB容量顯存,這将進一步推動大容量顯卡的出現。
HBM是後起之秀,目前隻有是AMD家獨使用,第一代HBM技術其堆棧的顯存核心容量2Gb(1個堆棧是4顆核心),數據頻率1Gbps,位寬1024bit。
顯存帶寬=顯存等效數據頻率(Gbps)*顯存總位寬(bit)/8=顯存實際頻率(MHz)*顯存數據倍率(1、2、4不等)*顯存等效位寬(64-512bit不等)/8
由于顯卡廠更習慣用數字更大更好看的數據頻率來标記産品規格,上述公司實際上還可以更簡單,直接變成:
顯存帶寬(GB/s)=顯存數據頻率(Gbps)*顯存等效位寬(bit)/8
拿NVIDIA的GeForce GT 720顯卡來舉例說明,該卡位寬僅為64bit,同時支持gDDR3和GDDR5顯存,前者的典型頻率900MHz,後者的典型頻率是1250MHz,兩種配置下帶寬分别是:
gDDR3:GT 720顯卡的帶寬為:900MHz *2*64 bit/8= 14.4GB/s,或者是1.8Gbps *64bit/ 8= 14.4GB/s。
GDDR5:GT 720顯卡的帶寬為1250MHz *4*64 bit/8 = 40GB/s,或者是5Gbps* 64bit/8=40GB/s。
轉自 架構師技術聯盟,如侵删。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!