天天看點

論SSD蹭熱點的姿勢:20ms連續掉電測試,還是100萬次開關機?

兵哥在文中是這樣寫的:

出于對SSD知識的了解,我想到了這種操作對電容的考驗。因為與HDD機械硬碟不同的是,SSD通常需要在DRAM/SRAM緩存中存放一部分映射表等中繼資料,而這些資料(無論多少)在掉電時會依賴電容備份到NAND閃存上。這個回寫的保護過程一旦出現異常,就可能遇到當年某I品牌SSD那種“8MB門”的故障。

當然,在兵哥面前我的SSD水準可能隻算是國小生,是以這個問題他不會沒想到。後來我看到兵哥也說了:“這樣測試算是比較極端的測試方法了,主要目的是測試電容在沒有充分充放電的情況下是否會出現故障,根據經驗,這樣情況非常容易出問題”。

我還想起來小時候有次惡作劇,把樓道裡的燈泡開關撥到中間的位置——恰好那燈就處于快速反複的亮滅切換中。故事的結局是第二天燈泡壞了——其實估計沒用24小時,按那種開關頻率鎢絲能撐1、2個小時報廢就不錯。

同樣測試硬碟難以承受,但這重要嗎?

我忽然想到一個問題:上面所說的這類測試,到底測的是高頻連續掉電,還是通/斷電循環(開關機)呢?

可能有朋友想問:“你這前後半句話說的不是一回事嗎?”我這句确實說的有點繞,然而卻牽涉到另外一個産品技術名額。不知您有沒有這樣計算過:

每20ms掉電一次,連續掉電1000次是多長時間?——20秒。也就是說測20秒的循環斷電,休息一分鐘,然後按這個間隔繼續。那麼24小時内SSD的總通/斷電周期是多少次呢?108萬次!

正如兵哥所說,如果是按正常方式通斷電而不是這麼極端,沒有機械部件的SSD承受100萬次加電周期,對許多産品來說應該問題不大。而如果換成HDD硬碟呢?

我去查了自己之前寫的兩篇文章,裡面竟然沒有統計這個參數。倒不是自己不知道,而是當時受篇幅所限沒有列進去。

上圖截自某品牌HDD技術文檔,有個磁頭加載/解除安裝周期的名額,目前主流普通桌面硬碟、NL-SATA/SAS硬碟、監控硬碟大多是60萬次左右的水準,在25℃、50%相對濕度的環境條件下。

對于這一點,是在比較理想的情況下——正常開關機,磁頭不在讀寫資料。筆記本硬碟由于節電模式會經常進入磁頭停泊狀态,會影響壽命嗎?不難算出,如果按照5年的設計壽命,假設365天開機,60萬次平均到每天328次磁頭加載/解除安裝也夠用了吧?

早期一些的磁頭斜坡加載設計硬碟,加載/解除安裝的次數名額為30萬。

如果是正好在讀寫資料的時候,意外斷電會使磁頭接觸盤片的機率增大,特别是當環境(機箱)振動超标的情況下。此時達不到設計壽命等級很正常,這大概就是人們讨論的話題由來了。

100萬小時MTBF與98%無故障派單率

接下來,我想分享最近在技術工作中的一點心得,也是和産品可靠性相關的。

上周出差給同僚做産品教育訓練,其中提到一個系列的商用桌上型電腦通過了100萬小時平均無故障運作時間認證。回想十幾年前,我當時的同僚,受人尊敬的孫老師主持過一次10萬小時MTBF的PC測試,那期間生産線同時跑着大量的機器。

平均無故障時間并不是說單品都可以用這麼久,而是指設計壽命(質保期)内大量樣本的故障發生間隔時間。客觀來講,更多代表設計水準而不見得總是真實反映每批次産品的情況。

另一個名額是98%的第一年無故障派單率,為了參照我對MTBF做了下列換算:

年平均故障率 AFR=1 / (MTBF / 365 / 24)≈0.87 %

2%的年實際故障率,比0.87%的設計水準還有些差距,但我覺得與MTBF測試的數值還是基本相符的。因為PC類産品的故障,許多還有些外在/使用者人為的因素,比如說供電品質、灰塵/空氣含硫超标、振動等等。

從細節處看筆記本品質改進

此外,我還看到一些關于筆記本的測試資料。

我們知道,像液晶屏的轉軸是比較容易老化的部件。對于有些插拔測試為什麼要人工而不是機器來做,業内人士的解釋是:“人工測試才容易模拟出不同的插拔角度”。

這時,我想起以前有的筆記本上帶mini HDMI接口,我曾經沒用多久就接觸不良,而後了解到許多朋友遇到同樣問題。這個如果是機器插拔測試就發現不了。

上圖也是很好的一個例子。左邊的無線網卡特别加了金屬片來防止天線的脫落,中間隻是用膠紙來輔助固定,右邊甚至沒有加強處理。

由于以前也拆過一些筆記本,包括自己的和朋友的,對這些細節會有深刻一些的體驗。膠紙很容易撕裂,而使用幾年之後膠帶也很容易老化脫落。

大約有一半的時候我拆筆記本是為了清理灰塵,也“挽救”過一些出風口堵住無法正常工作的機器。曾經有位同僚還給出個不用拆機的方法——用強力吸塵器從筆記本出風口直接把贓物吸出來,他還提醒我要保護鍵盤上的鍵帽不要被吸走。這時有多大氣壓估計大家能想象出來,如果内部有些元件固定不牢的話,也許再開機就會不正常了… 當然我舉的例子屬于極端一點的情況。

這些加強金屬架、防滾架對保持筆記本機身剛性、不變形至關重要。之前我曾用過一款入門級商用本,厚厚的工程塑膠,但運作時端起來走動不動就當機了。當時有同僚幹脆建議我合上蓋再移動:)

電源接口也是比較容易老化的部位。有的連接配接器直接焊在主機闆上,多次插拔——特别是難以完全避免的用力晃動後,如果出現脫焊的情況,整個主機闆需要拆下來維修(正常流程是返廠)。而左邊機型是有個專門的電源接口轉接件,與主機闆之間有連線,這樣就不會因為外力而直接傷害到主機闆,降低了維護中不必要的時間和開銷。

類似的例子還有許多,今天先寫到這裡。我想說的是,真正品質優秀的産品肯定不是一日之功,精品系列都是在設計、制造、售後中積累了豐富的經驗、不斷總結改進而來的。盡管PC類産品同質化相對高一些,而正是研發和品質控制體系上看似不明顯的差距,最終影響了市場格局和産品線的興衰。

繼續閱讀