天天看點

「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

作者:硬體電子工程師0

(搜尋WX公衆号:硬體電子工程師)

【摘要】

本文針對某産品生産拷機中不能正常開機問題,進行故障複現,定位到給單闆上的CPU提供時鐘信号的晶體頻偏超标導緻CPU無法啟動,最終定位是晶體性能問題需更換器件方案。

一、現象描述

某産品批量發貨生産中,出現偶發性不能正常開機,經排查和單闆CPU所用的晶體相關,晶體溫度穩定性較差頻偏超标導緻部分單闆晶體無法起振導緻。

表1 失效器件關鍵資訊

物料名稱 普通晶體諧振器(帶絕緣墊片)
器件型号 xxxxx
品牌 xxxxx
調整頻差@25±3℃ ±10PPM
工作溫度條件下允許的頻偏 ±30PPM
故障模式 部分失效品常溫時頻偏超标,部分失效品溫度升高至40多℃時,頻偏超标。

二、故障分析

本案例中我們按照三部曲來對該故障進行定位分析:

  1. 單闆級故障分析:以故障單闆作為整系統,對失效晶體系統級參數進行測試分析;
  2. 晶片級故障分析:脫離單闆硬體系統,對失效晶體單體參數進行晶片級測試分析;
  3. 材料分析:對器件進行拆解,深入器件内部結構、性能,準确定位器件失效原因。

1、單闆級分析

如下為現場傳回拷機時偶發故障的1#晶體樣品的排查測試過程:在室溫下能在單闆上正常工作,測試結果如下:

(1)常溫下,該晶體的振幅為1.2V(峰峰值),如圖1所示,符合手冊标稱typical幅值1.26V要求;

「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

圖1 常溫下1#晶體的波形圖

(2)為了快速複現現象,先使用吹風機輔助完成:使用吹風機緩慢加熱後,失效晶體的幅值先減小(如圖2),至停振(如圖3),再增大至860mV(如圖4所示);

「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

圖2 受熱後,1#晶體的波形圖(幅值變小)

「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

圖3 受熱後,1#晶體的波形圖(停振)

「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

圖4 停止吹風後,1#晶體的波形圖

  • (3)使用吹風機對正常的晶體加熱後,振幅無明顯變化。
  • 2、晶片級分析

    (1)晶體參數測試

    按照規格書給定參數測試1#樣品常溫及吹風機加熱條件下樣品的晶體參數, 發現1#樣品常溫下測試各參數結果滿足代碼級規格書要求,但吹風機40℃加熱時,樣品出現跳頻,跳頻幅度近120ppm,其他參數未出現異常。

    該産品中要求該晶體參數為負載諧振頻率(FL)±20ppm、諧振阻抗(RR)40Ω Max、DLD2<8Ω 。具體測試資料如表2所示:

    表2 晶體的參數測試表

    「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

    對1#樣品進行頻譜掃描,結果如1#樣品有明顯寄生振蕩頻率(如圖5所示),在約40℃ 時出現主振雙峰情況(如圖6所示),導緻樣品跳頻:

    「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

    圖5 1#樣品常溫頻譜掃描圖

    「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

    圖6 1#樣品約40℃加熱時頻譜掃描圖

    3、材料分析

    對正常樣品和1#樣品進行開封、内部目檢,發現1#樣品内部微調電極有明顯氧化,并有明顯污染,開封後的圖檔,如圖7未正常晶體樣品内部圖,圖8為故障1#樣品内部圖:

    「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

    圖7 正常樣品開封後圖檔

    「故障案例」高溫拷機CPU無法正常啟動問題定位與分析

    圖8 1#樣品開封後圖檔

    對故障樣品進行多樣品拆解分析,材料實驗室的分析結論如下:經測試分析,故障樣品由于内部晶片電極污染,該樣品設計或制造技術不足引起頻譜寄生振蕩,最終導緻諧振頻率跳頻。

    三、總結

    晶體或者晶振幾乎是我們每一塊單闆必需的器件,它的穩定與否直接關系到我們系統的穩定性,希望通過本文能給大家在以後類似的故障排查中提供一點思路。案例本身是次要的,技術文檔分析重在問題排查思路的分享,希望對大家有所幫助。

    繼續閱讀