天天看點

刷屏的清華AI光晶片,突破了什麼?

刷屏的清華AI光晶片,突破了什麼?

半導體産業縱橫

2024-04-26 18:20釋出于北京科技領域創作者

刷屏的清華AI光晶片,突破了什麼?

​最近,清華大學傳出了好消息。首創AI光晶片架構,研制全新AI“光晶片”——太極(Taichi),可以實作160 TOPS/W通用智能計算,能效是H100的1000倍。

訓練下一代萬億級參數大模型的高效晶片誕生了。目前,相關研究論文以“Large-scale photonic chiplet Taichi empowers 160-TOPS/W artificial general intelligence”為題,已發表在權威科學期刊 Science 上。

刷屏的清華AI光晶片,突破了什麼?

論文位址:https://www.science.org/doi/10.1126/science.adl1203

01

成果是什麼?

目前,越來越多迹象表明,LLM不會是通往AGI的最終路徑。

計算機早已經成為世界能耗巨頭,随着越來越多耗電量大的人工智能投入使用,計算機的能源需求也飛速上漲。

以英偉達H100為例,其峰值功耗為700 瓦,按照 61% 的年使用率計算,相當于一個美國家庭的平均功耗(假設每個家庭 2.51 人)。有專家預測,在大量部署H100後,總功耗将于一座美國大城市不相上下,甚至超過一些歐洲小國。

若是能夠發明一種,節省大量能耗的晶片,LLM的性能或在未來實作更大的提升。

而太極,可能會讓通用人工智能(AGI)成為現實。

根據清華大學官網介紹,清華團隊設計了基于內建衍射幹涉異構設計和通用分布式計算架構的大規模光晶片——太極,該架構具有上千萬個神經元的能力,實作160萬億次/秒·瓦(TOPS/W)的通用智能計算。

此外,在太極光晶片在實驗中實作了晶片上1000個類别級别的分類(在1623類别的Omniglot資料集上準确率為91.89%)和高保真的人工智能生成的内容,效率提高了兩個數量級。

研究人員表示,“太極”為大規模的光子計算和進階任務鋪平了道路,進一步發掘了光子學在現代AGI中的靈活性和潛力。

Science對這個研究有高度評論:“來自清華的團隊探索了分布式衍射幹涉混合光計算架構,有效地将光神經網絡(ONN)的規模提高到百萬神經元級别。通過實驗實作了一個晶片上1396萬個神經元的ONN,用于複雜的、千類級的分類和人工智能生成的内容任務。這項工作是向現實世界的光計算邁出的有希望的一步,支援人工智能中的各種應用。”

02

什麼東西,有什麼用?

電子晶片的瓶頸

當電子通過半導體和其他傳統內建電路元件時,會遇到阻力并産生熱量。随着設計者不斷将各種元件添加到晶片上,晶片産生的熱量自然會升高。電子這一特性甚至成為了微型晶片性能提升的障礙,同時也是計算機能耗如此之高的主要原因。

以電子為載體的技術發展已趨近實體極限,晶片尺寸降到極緻時出現的“功耗牆”難題,訪存瓶頸下大量資訊存儲不過來、計算不過來,以及電子晶片性能提升的同時成本效益降低。

在電路上,用光子替代電子的設想由來已久。

20 世紀六七十年代,研究者就已經開始開發光子晶片了。那時候,部分專家預計光子晶片會像傳統內建晶片一樣迅速微型化。

電路能耗降低,還是歸功于光的性質。光子晶片不存在電阻問題。因為由鐳射産生的光子能快速通過波導、調制器、反射器等原件陣列。是以,光子晶片産生熱量更少,能耗也更低。

光為載體的計算晶片

光計算,顧名思義是将計算載體從電變為光,利用光在晶片中的傳播進行計算。

人工智能時代是由算力支撐起來的,從能耗的角度來看,矽光技術能夠有效提升GPU的整體性能、大幅降低其功耗,有效解決目前的算力瓶頸。也就是說,下一代算力很可能會是光子計算甚至量子計算。

問題在于,目前的內建光子計算,特别是光學神經網絡(ONN),通常包含數百到數千個參數,其中數十個是可調參數,僅支援基本任務,如簡單的模式識别和元音識别。能夠進行一些簡單任務和淺層模型,無法支撐亟需高算力與高能效的複雜大模型智能計算。

光計算對于內建度的要求會更高,但其技術難點其實并不隻在內建,在計算單元循環使用和非線性處理方面挑戰更大。

據了解,一個巨大的AI模型中,每一層網絡都需要進行矩陣運算,一個大矩陣還可能需要拆成幾個小矩陣進行計算。也就是說,在大模型中,矩陣乘加運算是一個反複、循環的計算過程,每次循環,矩陣上的元素權重都會被更新。

與電子相比,光的矩陣乘加運算非常快,但一涉及到權重的更新,光的速度就會變慢。

要實作大規模、高能效的光子計算,簡單地擴大現有的光子神經網絡晶片是不現實的,因為随着神經網絡層數的增加,不可避免的模拟噪聲會呈指數級擴大。放大現有架構的規模并不能成比例地提高性能。

新架構:分布式衍射-幹涉混合光子計算架構

清華團隊進行了架構方面的研究,“從0到1”重新設計适合光計算的新架構。

根據論文介紹,清華團隊為采用分布式計算的太極,建構了一個深度較淺但寬度較廣的網絡結構。

與為深度計算堆疊一系列層的傳統方法不同,Taichi 将計算資源分布到多個獨立的叢集中,為子任務分别組織叢集,并最終合成這些子任務,進而完成複雜的進階任務。

具體地說,光學衍射層的完全連通特性,可以提供比傳統DNN中的卷積層更大的變形能力。

這意味着光學網絡有可能用比電子系統更少的層數實作相同的變換。

刷屏的清華AI光晶片,突破了什麼?

圖中(B)中展示了「太極」晶片,包括用于大規模輸入和輸出資料的雙衍射單元,以及用于可重構特征嵌入和硬體多路複用的MZI陣列的可調矩陣乘法。

論文第一作者、電子系博士生徐智昊介紹:“在“太極”架構中,自頂向下的編碼拆分-解碼重構機制,将複雜智能任務化繁為簡,拆分為多通道高并行的子任務,建構的分布式‘大感受野’淺層光網絡對子任務分而治之,突破實體模拟器件多層深度級聯的固有計算誤差。”

AI光晶片:幹涉-衍射融合計算晶片

在這項工作中,團隊設計了一種具有靈活分布式計算架構的大規模衍射-幹涉混合型光子AI晶片——「太極」。

據論文報道:“太極”光晶片具備879 T MACS/mm²的面積效率與160 TOPS/W的能量效率,實作了高達兩個數量級的能效提升。首次賦能光計算實作自然場景千類對象識别、跨模态内容生成等人工智能複雜任務。

03

國内光晶片企業情況如何?

在面向“後摩爾時代”的潛在颠覆性技術裡,光子晶片已進入人們的視野。其所具有的高速度、低能耗、工藝技術相對成熟等優勢,能夠有效突破傳統內建電路實體極限上的瓶頸,滿足新一輪科技革命中人工智能、物聯網、雲計算等産業對資訊擷取、傳輸、計算、存儲、顯示的技術需求。

目前,全球光子晶片産業剛剛起步,作為獨立于電子內建技術的新內建技術,其技術壁壘還沒有形成。大陸光子産業發展水準與世界處于并跑階段,在光子基礎理論研究和技術發展方面具有一定的優勢。

目前中國本土的高功率雷射晶片、部分高速率雷射晶片(10G、25G等)等已處于國産化加速突破階段,而光探測晶片、25G以上高速率雷射晶片剛剛起步。

值得注意的是,光晶片方面華為也有所布局。

今年3月,華為公布了一項“光晶片及其制備方法、通信裝置”發明專利。申請公布号為:CN117616316A,該專利申請日期為2021年9月18日。摘要顯示,本申請的實施例提供一種光晶片及其制備方法、通信裝置,涉及光通信技術領域,解決現有的光晶片中光波導在制備過程中尖端易斷裂的問題。

光晶片企業利潤下降

國内光晶片廠商有源傑科技、長光華芯和炬光科技等。在2023年度業績快報中,這三家企業均提到宏觀環境、行業發展的影響,導緻産品需求減少和價格降低。

源傑科技是國内領先的光晶片 IDM 廠商,産品涵蓋從2.5G到50G 磷化铟雷射器晶片。從源傑科技2023年的業績來看,營業收入共計約1.44億元,與去年同期相比下降48.96%,全年歸屬淨利潤盈利 0.195 億元,同比減少 80.58%。

長光華芯釋出的業績報告來看,也同樣處于虧損狀态。營業收入約2.92億元,同比減少24.2%;歸屬于上市公司股東的淨利潤虧損8610.17萬元。2023年1至6月份,長光華芯的營業收入構成為:高功率單管系列占比90.16%,高功率巴條系列占比8.24%,其他業務占比0.9%,VCSEL晶片系列占比0.7%。

炬光科技業務覆寫上遊“産生光子”“調控光子”及中遊汽車、泛半導體、醫療健康領域,與多家業内知名公司達成合作。炬光科技釋出2023年度業績快報,營業收入約5.61億元,同比增加1.69%;歸屬于上市公司股東的淨利潤8968萬元,同比減少29.44%

源傑科技表示“電信市場及資料中心銷售不及預期”;長光華芯稱“受宏觀經濟環境等因素的影響,市場信心不足,雷射器市場需求持續疲軟,同時行業競争加劇”,炬光科技稱“公司部分上遊元器件産品價格降低,綜合毛利率下降”。

檢視原圖 741K

  • 刷屏的清華AI光晶片,突破了什麼?
  • 刷屏的清華AI光晶片,突破了什麼?
  • 刷屏的清華AI光晶片,突破了什麼?

繼續閱讀