售前咨詢電話:
暉客科技-為您的數(shù)據(jù)保駕護(hù)航
新一代網(wǎng)絡(luò)存儲(chǔ)服務(wù)器/一站式數(shù)據(jù)管理平臺(tái)
不要再祈求神靈保佑了。
可能無法發(fā)現(xiàn)驅(qū)動(dòng)器故障,隨時(shí)發(fā)生,可能導(dǎo)致卷降級(jí)或卷崩潰。硬盤驅(qū)動(dòng)器故障導(dǎo)致容量下降,問題不大。因?yàn)橹灰业綋p壞的驅(qū)動(dòng)器,用新的驅(qū)動(dòng)器更換,就可以重建RAID陣列。然而,當(dāng)涉及到卷崩潰時(shí),這是一個(gè)更大的威脅。如果沒有備份計(jì)劃和災(zāi)害恢復(fù)解決方案,很可能會(huì)失去災(zāi)害性的數(shù)據(jù)。
那么,如何防止驅(qū)動(dòng)器故障呢?
是的,我們可以采取兩種預(yù)防措施,最大限度地減少駕駛故障引起的數(shù)據(jù)丟失的可能性:通常的SMART測(cè)試和事件觸發(fā)的通知。
首先,定期執(zhí)行SMART測(cè)試,掌握驅(qū)動(dòng)器的運(yùn)行狀況,必要時(shí)立即采取措施。SMART是自我監(jiān)控、分析和報(bào)告技術(shù)的縮寫,該技術(shù)是監(jiān)控驅(qū)動(dòng)器的可靠性,提供驅(qū)動(dòng)器當(dāng)前狀態(tài)的相關(guān)信息的監(jiān)控系統(tǒng)。利用一些參數(shù)檢查驅(qū)動(dòng)器是否開始出現(xiàn)問題,檢查SMART屬性。結(jié)果可作為驅(qū)動(dòng)器剩余壽命的指標(biāo)。
特別注意以下3個(gè)與壞扇區(qū)相關(guān)的SMART屬性1:重新分配的扇區(qū)計(jì)數(shù)(ID5)、重新分配的事件計(jì)數(shù)(ID196)和現(xiàn)在需要處理的扇區(qū)計(jì)數(shù)(ID197)。壞扇區(qū)是由磨損、過熱、沖突、文件系統(tǒng)錯(cuò)誤等無法讀取的數(shù)據(jù)群。檢測(cè)出損壞的風(fēng)扇區(qū)域后,將其重新定向預(yù)約空間——預(yù)約風(fēng)扇區(qū)域。這個(gè)重新分配的過程叫做重映。但需要注意的是,增加的重映操作可能會(huì)慢驅(qū)動(dòng)器的訪問速度,導(dǎo)致驅(qū)動(dòng)器結(jié)束。
理想的情況是降低上述屬性的值。因?yàn)檫@些值可以作為檢測(cè)驅(qū)動(dòng)器故障的基準(zhǔn)。無論谷歌,我們的統(tǒng)計(jì)數(shù)據(jù)顯示,這些屬性高度相關(guān)驅(qū)動(dòng)故障的機(jī)會(huì)很高。與沒有任何區(qū)的驅(qū)動(dòng)器相比,壞扇區(qū)的驅(qū)動(dòng)器出現(xiàn),驅(qū)動(dòng)器訪問失敗的可能性高10倍。
額外的預(yù)防層。
除了定期運(yùn)行SMART測(cè)試外,還可以在群暉SynologyNAS上進(jìn)行的另一個(gè)操作是在控制面板中高級(jí)選項(xiàng)卡下的內(nèi)存配置通知事件設(shè)置。特別選擇7個(gè)事件2,收到觸發(fā)的通知后采取必要措施。
我們從ICRC、IDNF和UNC三個(gè)常見的錯(cuò)誤術(shù)語開始。ICRC錯(cuò)誤是在主機(jī)和硬盤之間傳輸數(shù)據(jù)時(shí)發(fā)生的通信問題,而IDNF錯(cuò)誤是在驅(qū)動(dòng)器無法讀取損壞扇區(qū)的數(shù)據(jù)時(shí)發(fā)生的。UNC錯(cuò)誤表示硬盤驅(qū)動(dòng)器試圖讀取的數(shù)據(jù)損壞,無法用ECC(錯(cuò)誤糾正代碼)進(jìn)行糾正。以下是與這些錯(cuò)誤相關(guān)的事件3:
1.驅(qū)動(dòng)器重新連接(ICRC錯(cuò)誤)警報(bào)。
2.驅(qū)動(dòng)器重新識(shí)別(IDNF錯(cuò)誤)警報(bào)。
3.SynologyNAS啟動(dòng)時(shí),驅(qū)動(dòng)器重新連接警報(bào)。
4.具有讀取異常(UNC錯(cuò)誤)的驅(qū)動(dòng)報(bào)警。
接到上述錯(cuò)誤的通知,可能是驅(qū)動(dòng)器故障的警告信號(hào)。如果問題仍然存在,可能表明驅(qū)動(dòng)器不能正常工作。強(qiáng)烈建議您備份數(shù)據(jù),更換當(dāng)前驅(qū)動(dòng)器。除上述報(bào)警外,還應(yīng)注意其他三起事件。
5.驅(qū)動(dòng)器上的不良扇區(qū)增加。
6.驅(qū)動(dòng)I/O錯(cuò)誤。
7.SSD壽命警告4。
從長(zhǎng)遠(yuǎn)來看,由于累積的不良區(qū)逐漸丟失數(shù)據(jù),檢測(cè)出的不良扇區(qū)增加時(shí),會(huì)受到警告。破風(fēng)扇區(qū)域也可能導(dǎo)致驅(qū)動(dòng)I/O。然而,經(jīng)過幾次重試,驅(qū)動(dòng)器可能仍能正常工作。如果還出現(xiàn)這錯(cuò)誤,請(qǐng)備份數(shù)據(jù),通過SMART測(cè)試檢查硬盤驅(qū)動(dòng)器的狀態(tài)。順便說一下,可以參考Synology群暉產(chǎn)品兼容性列表來檢查SDD的預(yù)期壽命。接到警告時(shí),請(qǐng)考慮將驅(qū)動(dòng)器更換為健康驅(qū)動(dòng)器。因?yàn)檫@可能表示驅(qū)動(dòng)器即將發(fā)生故障。
安全勝過遺憾。
一般來說,驅(qū)動(dòng)器故障只是時(shí)間問題,但我們可以采取簡(jiǎn)單重要的預(yù)防措施,防止驅(qū)動(dòng)器故障,最終丟失數(shù)據(jù)。接到硬盤報(bào)警后,請(qǐng)采取先發(fā)制人的行動(dòng)。因?yàn)闉?zāi)害發(fā)生時(shí)忽視這些警告標(biāo)志可能會(huì)給你很大的代價(jià)。定期實(shí)施診斷SMART測(cè)試,可采取更積極的方法,深入了解驅(qū)動(dòng)器的現(xiàn)狀。
除了這些注意事項(xiàng)外,我們還需要定期規(guī)劃備份任務(wù),防止最壞的情況發(fā)生,以防止駕駛員出現(xiàn)意外故障。做好充分,可以最大限度地減少數(shù)據(jù)丟失的可能性。
在SynologyCommunity上,教你如何防止駕駛員出現(xiàn)故障。
1下表列出了三個(gè)與壞扇區(qū)相關(guān)的SMART屬性。
2在6.2.2之前的DSM版本中,這些事件的名稱是具有重新連接的磁盤(ICRC錯(cuò)誤)報(bào)警,具有重新標(biāo)記的磁盤(IDNF錯(cuò)誤)報(bào)警,啟動(dòng)時(shí)具有重新連接的磁盤報(bào)警,具有讀取異常磁盤(UNC錯(cuò)誤)報(bào)警,壞扇區(qū)超過限制的磁盤,磁盤I/O錯(cuò)誤和內(nèi)部磁盤壽命報(bào)警。
3這4個(gè)事件不包括在默認(rèn)通知設(shè)置中。建議選擇重選框,選擇通知媒體。
4只支持SSD驅(qū)動(dòng)器的壽命警告。
地址:北京市海淀區(qū)白家疃尚品園? ? ? ? ? ? ?1號(hào)樓225
北京群暉時(shí)代科技有限公司