一台服務器,不管是物理機還是虛拟機,必不可少的就是内存,内存的性能又是如何來衡量呢。
1. 内存與緩存現在比較新的CPU一般都有三級緩存,L1 Cache(32KB-256KB),L2 Cache(128KB-2MB),L3 Cache(1M-32M)。緩存逐漸變大,CPU在取數據的時候,優先從緩存去取數據,取不到才去内存取數據。
2. 内存與時延
顯然,越靠近CPU,取數據的速度越塊,通過LMBench進行了讀數延遲的測試。
從上圖可以看出:
所以我們在寫業務代碼的時候,如果想要更快地提高效率,那麼使得計算更加貼近CPU則可以獲取更好的性能。但是從上圖也可以看出,内存的時延都是納秒為單位,而實際業務中都是毫秒為單位,優化的重點應該是那些以毫秒為單位的運算,而内存時延優化這塊則是長尾部分。
3. 内存帶寬内存時延與緩存其實可謂是緊密相關,不理解透徹了,則可能測的是緩存時延。同樣測試内存帶寬,如果不是正确的測試,則測的是緩存帶寬了。
為了了解内存帶寬,有必要去了解下内存與CPU的架構,早期的CPU與内存的架構還需要經過北橋總線,現在CPU與内存直接已經不需要北橋,直接通過CPU的内存控制器(IMC)進行内存讀取操作:
那對應的内存帶寬是怎樣的呢?測試内存帶寬有很多很多工具,linux下一般通過stream進行測試。簡單介紹下stream的算法:
stream算法的原理從上圖可以看出非常簡單:某個内存塊之間的數據讀取出來,經過簡單的運算放入另一個内存塊。那所謂的内存帶寬:内存帶寬=搬運的内存大小/耗時。通過整機合理的測試,可以測出來内存控制器的帶寬。下圖是某雲産品的内存帶寬數據:
------------------------------------------------------------- Function Best Rate MB/s Avg time Min time Max time Copy: 128728.5 0.134157 0.133458 0.136076 Scale: 128656.4 0.134349 0.133533 0.137638 Add: 144763.0 0.178851 0.178014 0.181158 Triad: 144779.8 0.178717 0.177993 0.180214 -------------------------------------------------------------
内存帶寬的重要性自然不言而喻,這意味着操作内存的最大數據吞吐量。但是正确合理的測試非常重要,有幾個注意事項需要關注:
作者:ecs西邪
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!