天天看點

ReRAM “存算一體”應用于AI大算力的新思路

ReRAM “存算一體”應用于AI大算力的新思路

在大陸西部,一座座資料中心正在拔地而起,為全國輸送着源源不斷的算力。但資料計算往往伴随着巨大的功耗,是以發展資料中心和實作“雙碳”目标之間存在着巨大的沖突。在“碳中和”已經成為全球共識的當下,國家在近段時間推出的“東數西算”工程受到了社會各界廣泛關注。“東數西算”通過在全國布局8個算力樞紐,引導大型、超大型資料中心向樞紐内集聚,形成資料中心叢集,以此優化資源配置,提升資源使用效率。雖然“東數西算”為優化資料中心的供能結構提供了政策助力,但并不能從技術層面解決既有算力能效比和算力能耗綠色發展需求之間的根本沖突。計算晶片的功耗向來是晶片制造技術演進中備受關注的名額之一。在後摩爾時代,單純通過工藝制程的提升降低晶片功耗的路徑也日漸捉襟見肘,已經接近摩爾定律的實體極限。此外,巨大的生态依賴性也牽扯着各個AI應用場景的發展程序。

但随着基于ReRAM的全數字存算一體架構大算力、低功耗、易部署晶片的研發和産業化,這一難題似乎有了新的解決思路。

存算一體打破“存算牆”和“能耗牆”

在晶片産業發展的過程中有兩座繞不開的大山:“存算牆”以及“能耗牆”。

1946年,美籍匈牙利科學家馮·諾依曼(J.Von Neumann)提出了著名的存儲程式原理,此後70餘年,現代計算機發展到第五代,存儲器經曆磁存儲,光存儲等一路發展至半導體存儲,而馮·諾依曼結構是當下最主流的計算機結構的地位卻從未變過。但随着時代的飛速進展,存算分離結構的天生缺陷使得馮·諾依曼結構的電子計算機似乎已經難以滿足資料處理更海量、更快速、更低耗的需求。

為什麼說馮·諾依曼結構存在天生的缺陷?這是因為在該結構設計中,CPU通路存儲器的速度決定了系統運作的速度,這也使得系統對存儲器産生了絕對的依賴。随着半導體技術快速發展,CPU的運算速度已經遠遠超過了訪存速度,前者通常是後者的200倍以上,CPU在執行指令間不得不等待資料。CPU和記憶體之間的資料傳輸帶寬,以及傳輸過程中每一層代碼的手動優化,都成為限制計算機性能進一步提高的瓶頸,帶來“存算牆”問題。

而AI計算在處理大量資料的過程中,這些資料需要在計算和存儲單元中進行頻繁的移動,移動受制于關鍵部件的技術瓶頸,也帶來了晶片面積增加、接口IP成本增加、功耗增加等一系列問題,也就産生了“能耗牆”問題。

尤其當工藝制程的發展開始進入後摩爾時代,業界對于解決這一問題的全新的技術路線顯得更加渴求和迫切——于是,“存算一體”便被提了出來。這是一種将存儲和計算有機結合的非馮諾依曼架構,理論上計算可以直接在存儲器中進行,這樣既打破了系統對于存儲器的絕對依賴,還能夠極大地消除資料搬移帶來的開銷,徹底消除“存算牆”以及“能耗牆”的問題。

新型存儲ReRAM,實作存算一體的最優解

既然理論上是可行的,那麼實際又該如何實作存算一體呢?

大體上看,市面上大概有三個流派的方案實作存算融合:一是利用先進封裝技術把計算邏輯晶片和存儲器(如DRAM)封裝到一起,以高IO密度來實作高記憶體帶寬以及較低的通路開銷,或采用更先進的制程工藝,比如2.5D、3D的封裝以及高位寬的HBM接口等,實作近記憶體計算;二是在傳統DRAM、SRAM、NOR Flash、NAND Flash中實作存内計算;三是利用新型存儲元件實作存算一體。

但可惜的是,大部分技術還是無法真正地解決“儲算牆”和“能耗牆”的問題。

随着億鑄科技推出基于ReRAM研發的“全數字存算一體”技術,上述問題似乎有了解法。該晶片材料特性以及生産工藝相對成熟,可突破性能不足、使用場景受限、制造成本過高等多種問題,更易于實作大範圍普及和商業化應用。

不僅如此,基于憶阻器(ReRAM)技術的計算單元可以通過阻值器件的存儲記憶特性,利用基礎實體定律和原理完成海量的AI計算;通過存算一體的架構,可以節省把資料從記憶體單元逐層搬遷到計算單元的環節,進而得以節省因為資料搬遷而産生的大量衍生成本,這此類方式也符合國家對于碳中和、碳達峰的技術發展路線,改變了傳統AI運算資料量需要帶來巨大能耗的現狀。

從年增長率、速度、可擴充性、與CMOS的相容性、IEEE認定的新型存儲媒體要素、實際商業化程序等方面來看,ReRAM在與諸如相變存儲器、MRAM等其它新興存儲技術相比中,表現都是非常優異的。

ReRAM的強大優勢吸引了大量廠商的争相研究和應用落地,包括台積電、聯電、格羅方德、中芯國際以及昕原半導體等均已建立了可量産的商業化ReRAM産線,其中昕原半導體的國内第一條28nm制程後道産線,已可以量産商用出貨。

億鑄ReRAM全數字存算一體技術:具備大算力、低功耗、易部署的三大優勢

在ReRAM存算一體賽道湧入大量玩家的環境下,誰又能拿到突圍的先發優勢呢?

當下,ReRAM存算一體這個賽道有兩種解決方案,一種是模拟的,一種是全數字的,模拟方案天然吻合信号量的實體特性,但卻存在一定的精度受限的問題,另外它還會産生模拟和數字之間頻繁轉換的衍生成本。

作為業界首家采用全數字路線耕耘于基于ReRAM的存算一體大算力晶片的公司,億鑄科技采用的是另一種:全數字解決方案。基于ReRAM研發“全數字存算一體”的算力晶片,可以最大範圍提高産品精度,解決以前存算一體技術中模拟晶片低精度問題。此外,該方案還節省了模拟技術的衍生成本,形成了一套既能保證精度同時又能最優化面積和功耗的解決方案。

基于ReRAM的全數字存算一體AI計算架構,除了能有效地解決存算牆和能耗牆的問題之外,還可以解決當下的AI應用面臨的“編譯牆“問題。

在馮諾依曼架構下,計算非常依賴多級存儲的架構, 這種架構對編譯器非常不友好。編譯器在編譯代碼的過程中無法感覺代碼的動态特征,會出現卡頓、延遲的情況,而全數字存算一體可以把這些特征變成編譯器直接感覺的資源,保證時延确定性的同時自動優化資源的配置設定,可以友善客戶快速部署各類算法。

全數字存算一體架構時延确定和易部署的特性非常适合于自動駕駛的場景。自動駕駛包含的各類人工智能算法在運作之時會存在不同程度的時延問題,而存算一體的技術不僅可以解決時延不确定的問題,也可以提升系統的整體性能。

除了解決時延問題,還具有密度高、容量大、能效比高,能滿足自動駕駛大吞吐計算需求,在實體穩定性上也能滿足車規級産品在溫度變動、震動、穩定性的要求。

全面自主研發國産替代

從晶片發展的曆史來看,任何廣泛應用的好産品都必須與成熟工藝緊密合作,比如台積電與英偉達在曆史上的聯合調試,不斷優化台積電的先進工藝制程。而在ReRAM架構的全數字存算一體AI計算晶片這個領域,昕原半導體将會和億鑄科技強強聯手、緊密調試,再現當年英偉達和台積電雙劍合璧、共同發展先進制程工藝的經典案例。

昕原半導體基于Metal Wire工藝,在ReRAM器件的設計和制造技術已經實作了全國産化,昕原半導體已經完成業界首款28nm制程ReRAM晶片流片,并且,已建成中國大陸首條中試線,擁有了垂直一體化存儲器設計加制造的能力。此外,昕原半導體采用對CMOS友善的材料,能夠使用标準的CMOS工藝與裝置,對産線無污染,整體制造成本低,可以很容易地讓半導體代工廠具備ReRAM的生産制造能力,一旦在自動駕駛和AI等領域産生突破性的應用真正起量,工藝馬上就能夠跟上,這對于量産和商業化應用都有很大優勢。

近年來,國際形勢的變化,使得半導體産業鍊面臨的不确定性增加。也讓國産化成為半導體企業的重要建設主題之一。

億鑄科技和昕原半導體的聯合,也将會使得億鑄科技基于ReRAM全數字存算一體架構的大算力、低功耗晶片相關技術完全自主可控,實作從IP到生産的全國産化。

億鑄:小荷才露尖尖角,早有蜻蜓立上頭。

盡管億鑄科技現在十分年輕,2021年10月才開始在上海正式營運,但它已經是目前國内唯一自主設計基于憶阻器(ReRAM)的“存算一體”大算力晶片的公司。

2021年底,億鑄科技完成由中科創星、聯想之星和彙芯投資(國家5G創新中心)聯合領投的天使輪融資。值得注意的是,領投方均是硬科技投資領域的著名機構。那麼,能在如此多巨頭湧入的賽道中打出自己的優勢,并受到如此多資本的青睐,億鑄科技的底氣是什麼?

這個答案便是億鑄内部一支由産、學、研各界資深技術專家、精英工程師、創新領軍人才、産業化先驅組成的國際化創業團隊:

- 公司高管團隊均擁有20+年不同類型晶片及系統軟體研發、管理、市場、創業經驗。

- 公司研發團隊成員來自于國内外多家知名晶片企業和多所國内外著名大學,比如斯坦福、德州大學、上海交大、複旦大學和中科大等,已在具備頂尖學術和産業價值的頂會發表論文達40+篇,超過國内其他同類賽道團隊的頂會論文總和, 研究成果已在不少知名頭部公司商用化。

- 核心設計團隊完整覆寫器件、晶片架構、SoC設計、軟體系統及AI算法等全部技術領域。

- 工程團隊也擁有豐富的晶片設計與流片經驗豐富,能力卓越。

綜合學界和産業界頭部精英人才的強強組合,億鑄科技的團隊已完全覆寫存算一體晶片底層的實體層、電路設計、架構全棧、晶片産品參考設計方案、商業化落地以及生态建設等各個方面的需要。

後摩爾時代的AI算力賽道,期待新技術的彎道勝出

全球AI算力需求迅猛增長。2012年至今,雲端AI算力已經增長了超過30萬倍,在未來的很長一段時間内,也将保持這個增速。正因如此,國家大力支援相關産業發展。2020年是真正意義上的新基建元年,AI 算力作為AI技術與産業大規模發展的巨大驅動力,将成為整個新基建的核心支撐。但在後摩爾時代,AI算力的普及應用始終面臨存算牆、能耗牆和編譯牆三座大山的掣肘,緻使“高算力、低功耗、易部署”的市場呼聲也越來越高漲。但在傳統AI算力廠商先發優勢的客觀環境下,後來者很難在既有技術賽道上實作追趕。然而在新的技術領域比如基于ReRAM存算一體做大算力晶片,各國還處在同一起跑線,國内比如億鑄等先進初創公司已經起跑。

“時勢造英雄。”每一次計算構架的大變革都會創造一個新的王者。從主機時代的IBM、PC 時代的英特爾到移動時代的高通,智能物聯網時代必将會是新技術架構貢獻者的天下,我們期待ReRAM存算一體全數字計算這一新技術能夠成為解決存儲牆、能耗牆、編譯牆的新方案,在彎道勝出。

繼續閱讀