SSD(固態(tài)硬盤)的壽命問題是用戶使用全閃陣列時(shí)關(guān)注的焦點(diǎn)。如何能夠讓用戶放心使用全閃陣列,保障在5年內(nèi)存儲(chǔ)系統(tǒng)不會(huì)因?yàn)镾SD壽命耗盡而出現(xiàn)問題,是全閃陣列廠商面臨的挑戰(zhàn)。浪潮存儲(chǔ)通過優(yōu)化智能全閃G2-F的軟件棧,實(shí)現(xiàn)了SSD介質(zhì)的磨損均衡,使得智能全閃G2-F可以在長達(dá)5-10年的全生命周期內(nèi),給閃存介質(zhì)上的數(shù)據(jù)提供安全保障。
HDD和SSD可靠性上存在天然差異
HDD(硬盤驅(qū)動(dòng)器)是通過機(jī)械旋轉(zhuǎn)加磁介質(zhì)記錄數(shù)據(jù)的,而SSD則通過硅晶半導(dǎo)體記錄數(shù)據(jù)。二者記錄數(shù)據(jù)方式的差異決定了兩種類型的盤在存取速度和可靠性方面具有本質(zhì)差異。
HDD由磁頭和盤片組成,數(shù)據(jù)存放在盤片上的某個(gè)位置,當(dāng)對數(shù)據(jù)進(jìn)行讀寫,需要將磁頭移動(dòng)到磁道上,盤片轉(zhuǎn)動(dòng)到指定的位置。所以HDD是一個(gè)機(jī)械設(shè)備,只要加電,磁盤就處于高速旋轉(zhuǎn)工作狀態(tài)。磁介質(zhì)本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數(shù)據(jù)量,而取決于磁盤的上電時(shí)間。不過,磁盤的壽命跟工作環(huán)境有很大的關(guān)系,比如震動(dòng)對磁盤的壽命影響就非常大。
兩種存儲(chǔ)介質(zhì)
而NAND的存儲(chǔ)單元為三端器件,與場效應(yīng)管有相同的名稱:源極、漏極和柵極。如下圖所示,浮柵極是用來保存電荷的的,浮柵極與硅襯底之間是隧道氧化層,與控制柵極間也有一層絕緣層,上下兩層絕緣層保護(hù)浮柵極中的電荷不會(huì)泄漏。采用這種結(jié)構(gòu),使得存儲(chǔ)單元具有了電荷保持能力,通過讓絕緣浮置柵極捕獲不同數(shù)量的電子以實(shí)現(xiàn)bit值定義。就像是裝進(jìn)瓶子里的水,當(dāng)你倒入水后,水位就一直保持在那里,直到你再次倒入或倒出,所以閃存具有記憶能力。
NAND Flash原理示意圖
而對浮柵極的充放電,是利用量子隧道效應(yīng)實(shí)現(xiàn)的。當(dāng)我們要對FLASH進(jìn)行寫入操作的時(shí)候,在控制柵極上加高電壓,源極和漏極接地,使電子穿越隧道氧化層到達(dá)浮柵極,并聚集在浮柵上保持,形成電壓,用來存儲(chǔ)信息。進(jìn)行擦除時(shí)仍利用隧道效應(yīng),把電壓反過來加,從而消除浮柵上的電子,達(dá)到清除信息的結(jié)果。
由于在寫入和擦除的操作過程中,電子反復(fù)來回穿越隧道氧化層會(huì)損壞隧道氧化層,當(dāng)絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導(dǎo)致存儲(chǔ)單元物理損壞。這就是NAND Flash會(huì)有寫入次數(shù)限制的原因。
由于在寫入和擦除的操作過程中,電子反復(fù)來回穿越隧道氧化層會(huì)損壞隧道氧化層,當(dāng)絕緣氧化層破壞到一定程度,浮柵極中的電荷便不能再有效保持,導(dǎo)致存儲(chǔ)單元物理損壞。這就是NAND Flash會(huì)有寫入次數(shù)限制的原因。
HDD的實(shí)現(xiàn)原理和Flash完全不一樣,HDD由磁頭和盤片組成,數(shù)據(jù)存放在盤片上的某個(gè)位置,當(dāng)對數(shù)據(jù)進(jìn)行讀寫,需要將磁頭移動(dòng)到磁道上,盤片轉(zhuǎn)動(dòng)到指定的位置。所以HDD是一個(gè)機(jī)械設(shè)備,只要加電,磁盤就處于高速旋轉(zhuǎn)工作狀態(tài)。磁介質(zhì)本身的壽命是非常長的,所以磁盤的壽命并不取決于讀寫的數(shù)據(jù)量,而取決于磁盤的上電時(shí)間。不過,磁盤的壽命跟工作環(huán)境有很大的關(guān)系,比如震動(dòng)對磁盤的壽命影響就非常大。
通過對比SSD和HDD的工作原理,你會(huì)發(fā)現(xiàn)二者的故障模式有非常大的差異。傳統(tǒng)的磁盤軟壽命限制,因此需要對SSD的壽命管理進(jìn)行精細(xì)設(shè)計(jì),以此實(shí)現(xiàn)全閃存儲(chǔ)介質(zhì)的生命周期管理。
浪潮智能全閃:六招實(shí)現(xiàn)SSD介質(zhì)全生命周期管理
在上一篇關(guān)于如何減少SSD磨損的文章《寫放大<1:浪潮智能全閃G2-F閃存陣列是如何做到的》中,已經(jīng)詳細(xì)介紹了浪潮智能全閃G2-F全閃存儲(chǔ)多項(xiàng)全閃存儲(chǔ)的專有黑科技如何通過減少對SSD的寫入量,從源頭上提高SSD的使用壽命。但減少寫入只是保障可靠性的一個(gè)方面,對于各種原因?qū)е碌牟糠諷SD出現(xiàn)壞塊,還需要及時(shí)的檢測、預(yù)測和處理。下面讓我們來看看浪潮智能全閃G2-F都有哪些大招,來實(shí)現(xiàn)SSD全生命周期精細(xì)管理以應(yīng)對SSD的壽命挑戰(zhàn)。
招數(shù)1:T10 DIF杜絕靜默數(shù)據(jù)損壞
出了問題,首先要檢測到,防止靜默數(shù)據(jù)損壞。未被檢測到的靜默數(shù)據(jù)損壞會(huì)導(dǎo)致業(yè)務(wù)系統(tǒng)的嚴(yán)重后果。
T10 DIF(Data Integrity Field,數(shù)據(jù)完整性域)是用戶數(shù)據(jù)的一種端到端的保護(hù)機(jī)制,寫入數(shù)據(jù)的時(shí)候在數(shù)據(jù)塊末尾加入PI(Protection Information,保護(hù)信息)字段,存放數(shù)據(jù)的校驗(yàn)信息。當(dāng)存儲(chǔ)端接收到帶有PI的數(shù)據(jù)之后,會(huì)將PI信息保存起來,這樣在讀取的時(shí)候會(huì)重新計(jì)算,使得掉電,硬重啟,卷重啟,鏈路丟失等都不會(huì)導(dǎo)致PI數(shù)據(jù)的丟失。浪潮智能全閃G2-F全系列通過支持T10 DIF檢測,杜絕了靜默數(shù)據(jù)損壞。
招數(shù)2:SSD壽命預(yù)測提供事先警告
既然SSD壽命有限,SSD什么時(shí)候臨近壽命終點(diǎn)、什么時(shí)候需要更換,就成為用戶和存儲(chǔ)系統(tǒng)管理員最關(guān)心的事情。全閃存儲(chǔ)系統(tǒng)需要在SSD臨近壽命極限時(shí)對用戶進(jìn)行預(yù)警,給用戶預(yù)留更換乃至采購替代品的時(shí)間。同時(shí),如果用戶的業(yè)務(wù)模型、業(yè)務(wù)流量和初始設(shè)計(jì)時(shí)發(fā)生了巨大變化,存儲(chǔ)系統(tǒng)也需要給出預(yù)警信息,讓用戶采取措施調(diào)整業(yè)務(wù)模型或者數(shù)據(jù)布局,將大流量的數(shù)據(jù)寫入業(yè)務(wù)遷移到其他存儲(chǔ)上。這些必要的功能在浪潮智能全閃G2-F系列產(chǎn)品上進(jìn)行了全面配備,其中包括:
監(jiān)測壽命衰減速度:浪潮智能全閃G2-F定時(shí)檢查SSD使用壽命百分比,壽命衰減速度過快時(shí)會(huì)上報(bào)并告警,提醒用戶SSD盤異常,建議更換或者改變業(yè)務(wù)模型。
實(shí)時(shí)監(jiān)測使用壽命:當(dāng)SSD盤使用壽命達(dá)到97%,系統(tǒng)會(huì)建議用戶更換SSD盤;達(dá)到99%,會(huì)警告用戶及時(shí)更換SSD盤
智能剩余生命周期預(yù)測:浪潮智能全閃G2-F會(huì)根據(jù)用戶業(yè)務(wù)歷史流量及模型,對SSD可使用時(shí)間進(jìn)行預(yù)測,并根據(jù)用戶業(yè)務(wù)模型的變化,實(shí)時(shí)調(diào)整預(yù)測周期。當(dāng)預(yù)測到SSD剩余壽命大概為6個(gè)月時(shí),會(huì)產(chǎn)生告警,提醒用戶關(guān)注SSD壽命。
招數(shù)3:RAID壽命預(yù)測與自動(dòng)化功能凸顯神通
當(dāng)RAID成員盤的壽命臨近極限時(shí),系統(tǒng)會(huì)發(fā)出告警,使用CLI命令或GUI界面,檢查每個(gè)成員盤的“更換日期”字段,來確定需要更換的成員盤。如果RAID個(gè)別成員盤臨近壽命極限,只需更換個(gè)別成員盤,利用RAID冗余數(shù)據(jù)重建,更換盤后,RAID自動(dòng)重建該成員盤。
當(dāng)RAID多個(gè)成員盤臨近壽命時(shí),系統(tǒng)自動(dòng)更換RAID Group。浪潮智能全閃G2-F可以利用數(shù)據(jù)遷移功能自動(dòng)將該RAID中的數(shù)據(jù)在線遷移出來,方法是直接刪除該RAID——數(shù)據(jù)遷移功能會(huì)先將該RAID上的數(shù)據(jù)遷移到存儲(chǔ)池的其他RAID上,然后再刪除。如果存儲(chǔ)池其他RAID上沒有足夠的空間,刪除會(huì)失敗,需要先向存儲(chǔ)池添加新RAID后再刪除。
-
SSD
+關(guān)注
關(guān)注
21文章
2958瀏覽量
119341 -
實(shí)時(shí)監(jiān)測
+關(guān)注
關(guān)注
1文章
159瀏覽量
12948 -
HDD
+關(guān)注
關(guān)注
0文章
151瀏覽量
27901
原文標(biāo)題:六大招數(shù),破解全閃存存儲(chǔ)介質(zhì)壽命難題(上篇)
文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲(chǔ)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
華為OceanStor Dorado全閃存再獲殊榮

Flash閃存技術(shù)是什么?創(chuàng)世SD NAND Flash又有何獨(dú)特之處?#嵌入式開發(fā) #存儲(chǔ)芯片 #閃存
曙光存儲(chǔ)斬獲3800萬大單 曙光存儲(chǔ)FlashNexus中標(biāo)中國移動(dòng)全閃存集采
拯救NAND/eMMC:延長閃存壽命

電力行業(yè)應(yīng)用案例:頂堅(jiān)防爆巡檢記錄儀如何破解高危場景取證難題

影響25Q20D閃存芯片寫入速度和使用壽命的因素有哪些?

華為OceanStor Dorado全閃存存儲(chǔ)獲CC最高級別安全認(rèn)證
Deloitte的六大技術(shù)趨勢

EMC整改的六大步驟

評論