天天看點

挑戰-40℃-70℃極限值,這款邊緣計算裝置是如何煉成的

作者:大資料線上

計算是智慧時代一個永恒的話題。那邊廂雲計算已是熱火朝天,這邊廂邊緣計算已呈燎原之勢。

有人形容,邊緣計算是“人工智能的最後一公裡”,“物聯網的最後一公裡”,“打通使用者的最後一公裡”……邊緣計算看似不起眼,卻将承載起邊緣側海量的資料計算處理。但“最後一公裡”恰恰是最為艱難的一公裡,需求的多樣化和差異化,讓邊緣計算産業化受到一定程度的制約,落地略顯尴尬。

如何打破這種局面,讓邊緣計算不再“邊緣”,在更多業務場景中加速走向落地?來自浪潮資訊的一群人,他們并沒有選擇坐而論道和紙上談兵,而是深入到海南太陽暴曬的路口、東北寒冷偏僻的油井現場、西北大山深處的煤礦等地進行多方位需求調研,堅定地提出邊緣伺服器-40℃-70℃環境極限值挑戰,并且創新性地發明了三明治散熱架構,大幅提升邊緣計算裝置适用性。

挑戰-40℃-70℃極限值,這款邊緣計算裝置是如何煉成的

這些實踐無疑證明目前邊緣計算落地關鍵所在:即邊緣計算産品的研發與邊緣場景需求必須深入對接,既需要雙手沾泥般深入業務場景去了解真實需求,又能在産品研發上打破正常進行大膽創新,隻有這樣方能真正引領邊緣計算走向落地。

上山下海,才敢提挑戰-40℃-70℃極限

如今,在5G、大資料、AI、物聯網等技術的驅動下,邊緣場景在各大行業中迅速興起。Gartner預測,到2025年将有30%的資料會運作在邊緣,邊緣場景将會成為資料産生、智能應用的主陣地之一。

與資料中心等相對穩定的環境和專業的運維團隊不同,邊緣場景的環境可謂是千差萬别,更沒有專業團隊負責日常的運維與管理,這就讓邊緣裝置的研發遇到兩大挑戰:

其一,溫度、濕度、粉塵等環境因行業而異,不同行業的需求複雜多樣,對于邊緣裝置的适應性提出極高挑戰;

其二,邊緣場景尚未成熟,有着巨大的需求空間尚待探索,使用者需求也不明确,廠商沒有标準來參考開發邊緣裝置與方案。

“一切都需要以使用者為中心,去真實場景中探索詳細需求。例如,在室外一些智慧交通路口、智慧電網智能運維等場景中,使用者對于裝置的環境适應性、運作穩定性要求很高。”浪潮資訊邊緣計算産品線進階産品經理劉香男介紹道。

事實上,針對邊緣計算裝置部署環境這個最大的挑戰,浪潮資訊的産品團隊大膽提出了“-40℃-70℃”的部署環境溫度極限值。做出這個決定,産品團隊并不是拍腦門和想當然。從2020年浪潮資訊成立專門的邊緣計算事業部起,産品團隊在兩年時間裡進行了大量的使用者走訪與需求調研,并總結得出“-40℃-70℃”溫度極限值的産品研發需求。

但這卻給産品研發團隊提出了一個極大挑戰。衆所周知,由于環境的限制,邊緣計算裝置通常采用無風扇的設計,對于邊緣裝置的散熱是極大考驗,遠超市面其他産品的“-40℃-70℃”極限值需求着實讓研發團隊大吃一驚。

“當時拿到産品團隊的需求第一感覺是太難了。”浪潮資訊邊緣計算産品線進階硬體架構師付長昭如是說,“一開始甚至一些抵觸。因為接觸過一些包括霧計算、小型通信類裝置,也了解這些行業的規範與标準,很少有規範和标準會把無風散熱的極限值設定在70℃,覺得産品經理提的需求根本實作不了。”

在産品與研發不斷溝通之後,産品團隊覺得有必要讓研發了解“-40℃~70℃”極限值需求是真實存在且極其有必要。于是,産品團隊和研發團隊一起親自體驗了真實的邊緣場景。

“到了道路口的一個信控箱,打開一看,真是大開眼界,能想到的和想不到的全有,環境之複雜超乎想象。”付長昭回憶道,“此刻,我終于明白産品團隊所提需求絕非虛言,邊緣計算要想獲得有效地應用,必須克服這個難題。”

确認好需求之後,擺在研發團隊面前的難題就是:如何實作“-40℃-70℃”的極限值。由于并無先例,研發團隊一時并無頭緒,正當研發團隊陷入苦惱、壓力山大時,一塊三明治的出現,徹底“拯救”了研發小夥伴們。

一塊三明治帶來的啟發

衆所周知,散熱是邊緣計算裝置穩定運作的關鍵因素和最大難點。

這是因為如今的邊緣計算裝置早已不是簡單的執行控制程式,還需要進行大量的資料流處理、AI模型推理等,對于算力的需求大幅提升,也讓CPU的運作往往處于較為飽和的狀态,CPU一旦高速運轉,溫度最高可達90℃,加上像交通信号櫃等邊緣場景往往是封閉的鐵皮箱,環境溫度在夏天往往達到60~70℃,讓邊緣計算裝置的散熱更加困難。

“前期我們主要是确定研發方向:在散熱上蓋和熱源之間增加高導熱系數的導熱材料,讓熱量快速傳遞出去。”付長昭介紹道,“但嘗試了很多次,連60℃的散熱極限的都無法滿足。”

研發項目進度陷入停滞,研發團隊甚至一度動了“适應不了環境,就改變環境”的想法,與産品團隊溝通修改需求。對此,劉香男表示:“其實在産品研發過程中修改需求很正常。但70℃散熱極值的确是使用者的關鍵需求,為此,産品團隊與研發團隊也是進行持續溝通,幫助研發團隊了解需求和尋找可行方案。有時候再堅持堅持,捅破那層窗戶紙,方案就找到啦。”

為此,研發團隊再次拆解和梳理需求,把關鍵點、沖突點逐一列舉出來,利用思維導圖将問題點按照大小級别進行分類,以求尋找到關鍵的突破口。正當研發團隊再次陷入僵局,一塊加班中用來充饑的三明治引發了研發團隊的靈感。

三明治各種食材層層疊加的形狀,讓研發工程師們意識到可以借鑒到邊緣計算裝置的散熱上,散熱上蓋底部壓鑄出導熱凸台,通過導熱凸台與導熱界面材料、熱源部件依次貼合的結構,可以排出熱源上方的空氣,大大消除内部界面熱阻。

窗戶紙終于捅破了!“三明治”散熱架構就此誕生,散熱蓋、凸台、界面材料、熱源從上到下就類似一塊三明治。不僅如此,研發團隊還針對邊緣伺服器百變的配置需求,設計了不同形狀上蓋,讓導熱凸台、界面材料的位置、大小随着内部器件的變化而變化,實作産品的靈活百變和高效散熱。

挑戰-40℃-70℃極限值,這款邊緣計算裝置是如何煉成的

付長昭介紹:“研發團隊前前後後做了七版方案,終于經過不斷努力,尋找到最為合理的方案。”

有了整體的方案之後,接下來就是細心打磨、不斷優化的階段。例如,三明治的多層食材中,每一層食材的不同、食材的多少都會決定三明治的口感;同理,在“三明治”散熱架構中,每一層材料的差別是否也會帶來散熱效果的不同?為此,研發人員進行了仔細研究發現,界面材料厚度的微小差異,都會影響散熱的效率,材料厚度縮小0.6毫米,CPU的溫度就可以降低2.1℃。是以,研發團隊需要在CPU、記憶體等等部件凸台最小結構公差下,設計出最小厚度的界面材料。

經過多次仿真和實測,研發人員最終采用高導熱和高壓縮性的界面材料和凸台填充在熱源與散熱外殼之間,導熱效率達到10W/m·K,是空氣導熱效率的435倍,讓伺服器适應的極限環溫從原來的60℃提升到67℃。

67℃已經超越了很多邊緣裝置的極限值,但這還不夠,離最終需求還差3℃。正所謂行百裡者半九十,最後這3℃最為接近極限需求,那麼,還能有繼續優化的空間麼?

對此,付長昭介紹:“把CPU散熱這個最大難點解決了,等于大幅提升了内部熱傳導效率,相當于成功了一大半。接下來,可以從邊緣計算裝置整體散熱的角度去優化考慮,從機箱結構、每個部件等方面做到最優。”

随後,研發團隊從“裝置與環境之間如何進行高效導熱”的角度出發,利用熱仿真軟體對多組參數組合進行對比分析,并繪制響應面優化曲線,最終确定出一組關于鳍片厚度、間隙和高度的最優組合,在有限體積内形成超過3000平方厘米的散熱面積,達到了最佳散熱能力。同時,為了進一步讓上蓋均勻的将熱量擴散出去,消除局部熱點,散熱上蓋中設計了2D熱管網絡,熱管走向經過反複優化仿真,精準布局,有效規避局部熱點的産生,提升整機均溫能力。

終于,浪潮邊緣微伺服器EIS 800這台能夠在無風條件下、70℃極限環境也能高效、穩定運作的邊緣計算裝置橫空出世。

挑戰-40℃-70℃極限值,這款邊緣計算裝置是如何煉成的

“從最開始有一些抵觸,到接受挑戰,再到陷入煎熬,最後取得豁然開朗般的突破,研發工程師整個心理過程是在微妙變化的。有時候多一份堅持,問題也就迎刃而解,付出也是值得的。”付長昭如是說。

據悉,浪潮邊緣微伺服器EIS 800已經獲得2022年度德國紅點設計大獎,并且在制造、交通、能源、水利、零售等多個行業使用者的環境中通過了POC驗證,未來将在各個邊緣場景中發揮重要作用,進一步推動邊緣計算産業走向落地。

子產品化設計應需而變:一切為了邊緣計算

“邊緣計算裝置的産品設計與規劃,并不會圍繞某個部件的疊代而展開,而是會從實際需求的角度進行疊代。”這是劉香男兩年來最大的感悟。

不過,邊緣場景需求的差異化、多樣化,的确又是橫跨在邊緣計算裝置走向規模化的一大難題。差異化和多樣化意味着大量需求彼此互斥,需要單獨設計,産品通用性差,後期的維護、保障也會遇到各種問題。如何改變這種局面,真正讓邊緣計算走向落地?

在經曆了大量調研和反複論證之後,浪潮資訊提出了解耦子產品化設計的思路。這種思路類似樂高搭積木,形成核心計算模組、AI模組、通信模組、管理模組、散熱子產品等核心子產品,統一不同子產品的接口标準,再根據邊緣場景的差異化需求進行拆解群組合,實作不同邊緣場景的産品需求。

例如,智慧路口場景中,攝像頭從幾路到十幾路,邊緣計算裝置的算力需要階梯式布局;又如,在工業場景,需要更加靈活的通信方式,需要相容有和無線不同網絡通信;而針對油井、礦山等環境會出現的邊緣裝置低溫啟動難的問題,浪潮資訊研發團隊還為系統設計了遠端運維子產品,低溫熱啟動裝置,可以在環境溫度-40℃的環境下,遠端或自動調動系統來加熱邊緣計算裝置,讓裝置每部每個元件滿足溫度要求後再啟動運作。

從子產品元件解耦到根據需求進行靈活組合,既考驗邊緣裝置研發團隊的整體設計能力,又對于子產品之間組合後的産品效果提出挑戰。為此,浪潮資訊不斷摸索,推出了邊緣子產品化設計架構ECOM(Edge Computing Optional Module),并且對各個子產品之間通信進行優化。

據悉,浪潮資訊已經将邊緣計算子產品化設計标準ECOM貢獻給全球開放計算組織ODCC。付長昭坦言:“傳統伺服器的設計方式、理念、應用和标準比較清晰統一,但邊緣計算依然處于探索期,更加需要有意識地去完善标準,進而更好地推動邊緣計算技術快速落地。”

星空不問趕路人,歲月不負有心人。如今,浪潮資訊蟬聯中國邊緣伺服器市場第一,2022年上半年市場占有率甚至達到53.1%,同比大幅增長133.6%,領漲邊緣伺服器市場。“浪潮資訊會持續以客戶為中心,貼近使用者場景需求,攜手生态夥伴共同推動邊緣計算加速落地。”劉香男最後表示道。

繼續閱讀