最大的資料存儲雲公司之一Backblaze剛剛披露了其年度硬碟故障報告,涵蓋了他們内部以及合作夥伴和客戶使用的資料驅動器。該公司利用HGST、希捷、東芝和西部資料的資料驅動器,驅動器大小在4TB到16TB之間。在2022年年初,我們讨論了硬碟的壽命,西部資料是同名單中被消費者看好的公司。
今天,Backblaze披露了他們在8月份采用的29種不同硬碟型号的2022年第二季度的統計資料。希捷公司在列出的硬碟中突出了最明顯的變化。
最近一期分析報告的作者、Backblaze的首席雲存儲技術主管Andrew Klien指出,在去年年底,該公司管理着235,608台硬碟,其中4,299台為系統硬碟,231,309台為資料硬碟。報告中不包括啟動系統的驅動器,因為消費者更經常使用資料驅動器。在231,309個驅動器中有388個被剔除,因為該公司将它們用于内部測試或少于60個實體單元。在今年年底,230,921個硬碟參與了2022年的故障率分析報告。
上圖顯示了Backblaze的硬碟在一年内的故障率。該公司再次使用了29個不同的型号,其中希捷的14TB硬碟(ST14000NM0138)在使用的1519個硬碟中,故障率平均為5.7%。有趣的是,希捷這些硬碟的故障率的平均故障年齡(以月為機關)為24.8。硬碟故障率最低的也是希捷公司,他們的8TB硬碟(ST8000NM000A)比去年完全沒有損失。該型号的硬碟有79塊,使用天數最少,Backblaze指出,8TB希捷硬碟被用作其它8TB硬碟故障的備用硬碟。
有兩個型号的工作平均天數最多,一個來自希捷(6TB,ST6000DX000),一個來自東芝(4TB,MD04ABA400V)。兩者的平均天數都超過了90個月,而且兩者之間的故障率也很高,盡管東芝隻有94台硬碟在使用,而希捷有886台。希捷硬碟持續工作八年時間令人印象深刻,每年的故障率不到1%,特别是在硬碟數量幾乎是其他樣本的八倍的情況下。
在過去的三年裡,平均故障率上升了0.44%,Backblaze在報告的早期将其歸結為驅動器的年齡。然而,該公司進一步分解分析,看看平均故障率的增加是否是如此,首先是驅動器的大小和故障。
驅動器被分成兩類,一類是容量在10TB及以下的驅動器,另一類是12TB及以上的驅動器。小型硬碟的平均故障率增加了0.85%,而大型硬碟的變化為+0.20%。Backblaze指出,與大型驅動器相比,小型驅動器占整體驅動器故障的44.5%。
以上述圖表為例,Backblaze将圖表轉換為兩個表格,第一個表格顯示了所有驅動器尺寸的平均年齡(以月為機關)和終身平均故障率,即AFR。第二個表格進一步整合了驅動器,列出了較老的驅動器,以顯示故障的增加,這在2013年4月至2022年12月的變化中更為突出。
在這部分分析的最後,長時間使用是導緻該公司目前硬碟故障率增加的原因。在2023年,Backblaze預計将用更大的硬碟取代許多舊硬碟,從16TB以上開始,這意味着他們的小硬碟在使用中會少很多。
關于硬碟故障最嚴重的制造商,希捷和東芝在2020年第一季度資料開始接近持平。然而,在去年第四季度末,希捷的平均故障比例最明顯。希捷也是Backblaze手裡工作時間最長的硬碟的制造商,是以出現大量的故障數是合理的。
這是否意味着希捷硬碟多年來一直在惡化,消費者應該避免使用它們?Klien指出,希捷的幾個型号都很有成本效益,随着時間的推移很容易更換。但如果他們使用更高的硬碟存儲,并逐漸淘汰舊型号,這些數字可能會改變。
總體來看,硬碟的終身故障率比上一季度減少了0.01%和0.02%。事實上,在分析的226,041台硬碟中,總共有333,011,602個硬碟工作日,總體上有12,722個硬碟故障。