硬盤太慢 英特爾傲騰來補(bǔ)

2017-04-17 09:14 來源:美通社 作者:SWEET

2017年3月,英特爾發(fā)布的面向臺(tái)式機(jī)的英特爾傲騰? 內(nèi)存模塊(16GB和32GB),將從4月24日起上市。在半導(dǎo)體技術(shù)驅(qū)動(dòng)下,計(jì)算機(jī)性能沿著摩爾定路突飛猛進(jìn),然而,仍舊逃離不開“存儲(chǔ)”的瓶頸制約,拖累整個(gè)系統(tǒng)性能提升緩慢。使用閃存(NAND)加速的想法一直都在,Wintel都有嘗試,今天,傲騰(Optane)將有機(jī)會(huì)改變這一切。

雖然已經(jīng)有了數(shù)十年的歷史,但是馮·諾依曼1946年提出的計(jì)算機(jī)體系架構(gòu),仍是現(xiàn)在乃至可見的未來,計(jì)算機(jī)所遵循的基本架構(gòu)體系:存儲(chǔ)和計(jì)算。CPU是大家所熟悉的計(jì)算核心,但是并非馮·諾依曼體系中的計(jì)算核心,按照大學(xué)計(jì)算機(jī)原理課老師所說,CPU非常笨,它只會(huì)做“1+1”這一件事,而且只會(huì)從A、B寄存器取數(shù)、結(jié)果放到C寄存器,馮·諾依曼體系中的計(jì)算是指ALU(數(shù)邏運(yùn)算單元)而存儲(chǔ)是寄存器。當(dāng)然,這是最狹義的馮·諾依曼體系理解,不過也從側(cè)面說出了計(jì)算和存儲(chǔ)相依相存的特殊關(guān)系。

速度快當(dāng)然是王道,但是非常遺憾,半導(dǎo)體技術(shù)發(fā)展到今天,仍然不能解決容量和性能的根本矛盾,考慮到成本和實(shí)現(xiàn)因素,最終的產(chǎn)品都是性能向成本的妥協(xié)。歷史上看,誰能將兩者的平衡點(diǎn)向性能或容量任一端推動(dòng),定將帶來世界的巨大改變。SRAM到DRAM、閃存盤對(duì)軟盤/光盤、SSD對(duì)HDD,以及剛剛面世的Optane。

快慢設(shè)備的銜接

“多點(diǎn)潤(rùn)滑、少點(diǎn)摩擦”,這是海灣戰(zhàn)爭(zhēng)期間的著名潤(rùn)滑油廣告。而對(duì)于計(jì)算機(jī)來說,高速和低俗設(shè)備之間,對(duì)獲取數(shù)據(jù)方面的摩擦一直沒有停止過,解決這種數(shù)據(jù)沖突的方式也在革新。

以速度最快的ALU為例,與之進(jìn)行數(shù)據(jù)交換的寄存器有著相同速度的寄存器,除去在相鄰周期里循環(huán)存取的時(shí)間周期不算,兩者實(shí)際上是同頻同步工作的。寄存器有著動(dòng)輒數(shù)GHz的運(yùn)行速度,只能集成在離ALU最近的地方,但代價(jià)是成本高昂、容量以字節(jié)為單位精打細(xì)算,這就是為什么如AVX 2.0中的256位指令/數(shù)據(jù)寄存器,英特爾更壕一些,直接放入256位長(zhǎng),而AMD摳門些,旗艦的Ryzen 7 1800X只有128位寄存器,256位數(shù)據(jù)需要兩個(gè)周期讀入和寫出,性能折損極大。當(dāng)然,處理器廠商們?cè)缫炎⒁獾竭@個(gè)問題,n年前就大肆引入Cache結(jié)構(gòu)作為從寄存器到內(nèi)存的梯級(jí)緩沖,用數(shù)量和逐漸提高的速度解決計(jì)算單元從內(nèi)存獲取數(shù)據(jù)的性能落差。L1、L2、L3 Cache容量通常為數(shù)十KB、數(shù)百KB和數(shù)MB,對(duì)應(yīng)容量提升一個(gè)級(jí)別,速度也降低一個(gè)級(jí)別,以匹配慢速的GB級(jí)別內(nèi)存。為了保證速度,Cache通常會(huì)采用SRAM(靜態(tài)內(nèi)存)制作,而內(nèi)存雖然用了DRAM速度低了不少,但當(dāng)年正是DRAM的出現(xiàn),讓配有64KB內(nèi)存的PC有機(jī)會(huì)誕生,要知道同容量的SRAM當(dāng)時(shí)價(jià)格超過2500美元,而第一臺(tái)PC的不過1999美元。

類似的情況也出現(xiàn)在“存儲(chǔ)”設(shè)備上,雖然以硬盤(HDD)為代表的存儲(chǔ)設(shè)備已經(jīng)是外設(shè)“矬子里面的將軍”,但是它和PC系統(tǒng)之間的性能落差仍然很大,其性能包括了帶寬和響應(yīng)延遲等兩個(gè)維度的速度。于是另一種緩存,Buffer出現(xiàn)了。別看中文都是“緩存”,但是在計(jì)算機(jī)詞匯中,Cache和Buffer是兩個(gè)不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉價(jià)的DRAM以緩解I/O接口兩側(cè)的速度不匹配,最常見的情形是Buffer容量作為HDD的重要參數(shù)標(biāo)識(shí)產(chǎn)品檔次。無論是哪種緩沖,都能在響應(yīng)時(shí)間和帶寬上同時(shí)匹配兩端性能,兩端都認(rèn)為對(duì)方遷就了自己的性能水準(zhǔn),而沒有察覺到緩沖的加入,此現(xiàn)象就叫透明。

容量與性能的分歧

經(jīng)過多級(jí)緩沖,DRAM的速度已經(jīng)遠(yuǎn)遠(yuǎn)落后于CPU,但即便如此,它仍遠(yuǎn)遠(yuǎn)高于主流的存儲(chǔ)設(shè)備。更具體點(diǎn)說,單通道DDR4-2400內(nèi)存帶寬已近20GB/s、延遲為30ns左右,而容量已突破10TB的HDD,對(duì)應(yīng)的性能水準(zhǔn)只略微增長(zhǎng)到150MB/s~200MB/s帶寬,延遲則停留在3~4ms(接口)+7~8ms(平均尋道)的10年前水平,明顯不能滿足當(dāng)下電腦系統(tǒng)的需求。于是這才有了近幾年最有效的升級(jí)已經(jīng)從增加內(nèi)存變?yōu)榱烁鼡QHDD為SSD。SSD綜合性能較HDD已經(jīng)有了質(zhì)的飛躍,主流產(chǎn)品接口帶寬突破1GB/s水平、延遲下降到μs量級(jí),但與之伴隨的就是10倍的價(jià)格差異。

無論是容量還是性能,對(duì)使用體驗(yàn)的影響都是顯而易見的。在預(yù)算有限的前提下,考慮到時(shí)間可以換取性能而容量不行,更多數(shù)消費(fèi)者都傾向于容量更大而非性能更高,這也就是為何仍有超過85%的臺(tái)式電腦選擇HDD作為唯一存儲(chǔ)設(shè)備的原因。但凡預(yù)算寬裕一些,或者性能的需求稍占上風(fēng),雙硬盤就成為更為理想的搭配。現(xiàn)實(shí)是很殘酷的,艱難的預(yù)算增加,并不能帶來如一的性能體驗(yàn),頻繁使用的數(shù)據(jù)固然可以手動(dòng)放置到SSD中,但是相對(duì)較小的容量被占滿后,越是大量的數(shù)據(jù),越會(huì)深刻體會(huì)到“慢”的熬人,小容量SSD對(duì)此無能為力。

能夠彌合電腦與HDD性能落差、解決SSD與HDD容量落差的Optane來了。

橫空出世

SSD的出現(xiàn),可謂是近年來存儲(chǔ)領(lǐng)域最大的技術(shù)革新。以高速旋轉(zhuǎn)的磁碟片為基礎(chǔ)的HDD,數(shù)十年來維持在溫徹斯特架構(gòu)下幾乎沒有變化,無論是體積縮小還是容量增加,都不能很好地解決速度問題,哪怕是即將到來的熱輔助磁存儲(chǔ)技術(shù),也只是幫助容量大幅提升而對(duì)性能的提升仍是隔靴搔癢,機(jī)械原理限制了HDD性能質(zhì)的升級(jí)。SSD核心的改變正在于以半導(dǎo)體取代機(jī)械,ms進(jìn)入μs、MB/s提升到GB/s。按下葫蘆起來瓢,SSD讓成本和耐久性問題浮出水面,NAND的存儲(chǔ)介質(zhì)可謂“萬惡之源”。

NAND是閃存(Flash)中最主要的類別,具有讀寫耐久性隨制程提升下降、性能隨制程提升下降等固有特性,特別是為了在有限的晶圓(成本)上獲得更大容量,制程和單元結(jié)構(gòu)升級(jí)一直沒有停止過,如今NAND已經(jīng)進(jìn)入10nm時(shí)代、TLC漸成主流,反觀其耐久性艱難維持在2000次左右,延遲和介質(zhì)性能改進(jìn)緩慢。

2015年,英特爾正式發(fā)布了名為3D XPoint的全新非易失性存儲(chǔ)技術(shù),這就是橫空出世的Optane傲騰;與英特爾合作生產(chǎn)相關(guān)產(chǎn)品的美光,則將其命名為QuantX。3D XPoint或者說Optane與NAND/NOR等Flash完全不同,而更接近于內(nèi)存,延遲、耐擦寫性、介質(zhì)速度等幾個(gè)關(guān)鍵指標(biāo)也優(yōu)于NAND幾個(gè)數(shù)量級(jí),未來發(fā)展?jié)摿薮?,英特爾的目?biāo)是用其擴(kuò)大僅有5%左右的SSD市場(chǎng)份額。

Optane的非易失性和性能優(yōu)勢(shì),使其可在計(jì)算機(jī)系統(tǒng)中扮演多種甚至是任何存儲(chǔ)角色:內(nèi)存、存儲(chǔ)和緩存,分別對(duì)應(yīng)Optane DIMM、Optane SSD和Optane Memory,從而改變整個(gè)計(jì)算機(jī)存儲(chǔ)發(fā)展進(jìn)程。目前后兩類產(chǎn)品已經(jīng)上市。

為了獲得極速的存儲(chǔ),一種名為RAMDisk的產(chǎn)品已經(jīng)問世多年。它采用單位容量昂貴的DRAM為存儲(chǔ)介質(zhì),使系統(tǒng)用訪問硬盤的方式訪問它,性能當(dāng)然是內(nèi)存水平的,而容量也是內(nèi)存水平的數(shù)GB。顯然,這樣的容量水平對(duì)PC都不夠用,何況這樣的“硬盤”還要面臨掉電數(shù)據(jù)丟失(易失性)的問題,使用時(shí)先要從硬盤讀取數(shù)據(jù)、關(guān)機(jī)前人工將數(shù)據(jù)寫回硬盤,可用性不佳。今天,Optane SSD已經(jīng)具有了RAMDisk的性能卻有著數(shù)TB的超大容量和非易失性,后者已經(jīng)沒有繼續(xù)存在的意義。

Optane Memory則是比NAND更為理想的緩存材料,更高的耐久性和ns級(jí)的響應(yīng)速度,比當(dāng)年英特爾涉足緩存領(lǐng)域的TurboMemory所使用的SLC NAND表現(xiàn)優(yōu)1~3個(gè)數(shù)量級(jí),更別提如今漫天的TLC產(chǎn)品了。性能改善之余,32GB的超大容量早已突破系統(tǒng)緩沖的需求,甚至作為超高性能的SSD也不為過(想想Optane SSD的表現(xiàn)),它更大的作用是為Windows以外的更多應(yīng)用和數(shù)據(jù)進(jìn)行緩沖和優(yōu)化,實(shí)用性遠(yuǎn)超當(dāng)年512MB的TurboMemory產(chǎn)品。只要用上英特爾200系列的芯片組和7代酷睿處理器,Optane Memory的延遲水平直逼DRAM。想象一下有否體驗(yàn)過內(nèi)存的延遲水平或速度不足,沒有吧?未來“硬盤”也不會(huì)再有今天煩人的等待,與內(nèi)存同速。


半導(dǎo)體 消費(fèi)電子

相關(guān)閱讀

暫無數(shù)據(jù)

一周熱門