天天看點

AI晶片格局震蕩,國産廠商“錢途”幾何?

作者:與非網

過去的一年,國内AI産業面臨巨大挑戰,大算力AI晶片和闆卡被“卡”,AI晶片軟體生态也面臨巨大困難。業界普遍認為,除了美國英偉達等産品外,使用其他産品進行大模型開發難度極大。 這種形勢其實也反映了市場需求的大幅增長和技術進步的迫切需求。大模型尤其是多模态大模型的出現,正在将AI帶到更多領域,對AI技術發展起到巨大的推動作用。 近期,英偉達“中國特供版”晶片遇冷的局面,也給國産AI晶片帶來更大的想象空間。國産AI晶片是否有望開啟新格局、并深遠影響AI技術的發展?對話AI明星企業,探尋産業的關鍵動力和發展趨勢。

Imagination:AI SoC設計靈活性是關鍵

過去幾年,Transformer已經取代傳統卷積神經網絡成為AI的首選,這在硬體方面産生了重大影響,尤其是對那些通常隻針對少數算法優化進行定制的AI加速器。 這給硬體設計師帶來了挑戰,他們往往希望能夠面向未來工作負載繼續進行優化。這在産品生命周期較長的市場中尤其明顯,例如在汽車行業,随着車輛連接配接性的增強,汽車甚至可以在車載SoC設計後十年内接收軟體更新。 Imagination副總裁、中國區總經理劉國軍認為,“鑒于AI軟體的持續進化,将設計靈活性整合到SoC中可能比僅專注于固定功能性能更為理想。”

AI晶片格局震蕩,國産廠商“錢途”幾何?

Imagination副總裁、中國區總經理 劉國軍

行業呼喚晶片架構突破“三角束縛”

後摩智能聯合創始人項之初談到,如何讓大模型更廣泛落地,形成商業閉環,為大衆帶來經濟價值和福祉,是需要進一步探索的。從支撐大模型底層的算力晶片角度看,目前并沒有找到特别好的方案,能夠在性能、功耗、成本等方面都能滿足大模型在更廣泛場景的落地需求。 “顯然不能到處去部署大幾百瓦、幾萬美元一顆的GPU。是以我們需要更創新的晶片架構,去突破馮諾依曼架構對算力、功耗、成本這個不可能三角的束縛”,項之初表示。

AI晶片格局震蕩,國産廠商“錢途”幾何?

後摩智能聯合創始人 項之初

大模型不是“萬金油”,算力是關鍵

鲲雲科技合夥人、COO王少軍博士認為,2023年,國産大模型爆發式增長,但真正實作産業落地還需要時間。目前,許多行業仍然主要使用傳統的深度學習方法,如CV和NLP類算法。而新應用場景更加具體化,AI技術需要與具體業務需求結合得更緊密。 他指出,AI企業不僅需要具備技術能力,還要與各行業合作,深入了解業務場景,才能真正發揮AI技術的實際作用。 在AI的發展過程中,如何将産品落地到實際場景一直是一個挑戰,大模型能否改變這一現狀?王少軍表示,對于正常場景,大模型有望解決這一問題,但對于一些長尾、稀缺場景,大模型仍存在局限性。在他看來,算力才是大模型時代最基礎、優先級最高的問題,如果沒有足夠的算力,其他技術得以有效應用的基礎也不存在。

AI晶片格局震蕩,國産廠商“錢途”幾何?

鲲雲科技合夥人、COO 王少軍博士

全面突圍:多元晶片架構+軟硬體生态

AI晶片競争日趨激烈,而沿用原有技術路線、依靠先進工藝來提升晶片性能,不論是從技術發展角度、還是在目前的國際背景下,都變得越來越難。 “單純依賴晶片工藝并不能確定産業的持久發展,在國内可控工藝條件下,通過架構創新來實作性能更優、成本效益更高的晶片,應該是國内大多數晶片公司努力的方向”,王少軍談到,“隻有當産品成本效益足夠高,滿足市場競争需求時,行業才算真正做好,從業者的能力才算真正提升。目前,産業界應該積極探索底層技術創新和産業發展的新路徑。資料流架構就是一個備受關注的方向,國内外一些大型公司也在緻力于可重構資料流的研究。這個方向具有廣泛的應用場景,适用于雲、邊、端各種場景。” 除了資料流架構,存算一體AI晶片架構也被認為有潛力承擔大模型時代的底層算力支撐。項之初表示,“存算一體作為一種新的晶片架構,需要資本、人才和社會資源的共同投入,促進研發和落地,同時也需要更多的應用機會進行疊代。” 劉國軍認為,随着邊緣AI無處不在,對于那些要求快速響應、高度安全或在網絡連接配接不穩定的情況下運作的應用,直接在裝置上處理AI工作負載的能力變得至關重要。并且,賦予AI晶片設計靈活性至關重要,特别是在邊緣裝置有限的面積、記憶體和功耗條件下。他介紹,Imagination GPU IP能以高性能和高效率處理計算工作負載,而且支援包括OpenCL在内的常用API,具備高度可程式設計性。通過持續投資軟體領域,包括工具、庫、模型和驅動程式等,希望提供最優的計算程式設計環境。“人工智能的普及預計将主導半導體行業及Imagination未來的業務發展”,他補充道。

行業或将洗牌,大模型持續進化

千芯科技董事長陳巍認為,大模型主要有以下四大趨勢:首先,大模型還會進一步進化。從目前看來,Transformer結構雖好,但對于超長token生成時,算力資源呈幾何級數增長,對于程式設計等長文的自動生成并不友好。有較大機率會有新的結構替代,或者Transformer自己進化,形成新一代的大模型基礎結構。

AI晶片格局震蕩,國産廠商“錢途”幾何?

千芯科技董事長 陳巍

第二,多模态大模型和混合專家(MoE)模型會逐漸成為新的主流模型。目前文本模态的大模型是主流,但随着技術的進步,多模态大模型會提供更多的功能、落地應用。另外大模型的主體會逐漸演變到MoE模式,而這兩者都會對算力有更高要求。 第三,大模型逐漸具備自學習能力。目前的大模型訓練還是離線的,這使得模型訓練後就固化,難以随着應用場景自動适應。預估1-2年,自适應學習的大模型會逐漸進入應用領域,更好地服務人類社會。 第四,CUDA生态有一定機率被其他開源生态取代。目前來看,CUDA生态是主流,但由于CUDA程式設計模型本身是以緩存為中心的,與目前大模型的分層結構有一定的排程沖突。從這個角度看,現有的CUDA生态也是大模型算力發展的障礙。随着微軟、Google、特斯拉等巨頭自研大模型晶片的進度加快,預計這些巨頭也會協力推動新的并行硬體程式設計生态。 王少軍則從算力和大模型角度提出兩大值得關注的方向:一是推理的重要性,随着大模型應用在更多場景,推理将成為關鍵,需要關注推理晶片的計算訴求和系統要求,以降低成本并提高易用性,進而推動大模型在行業中的快速落地。二是大模型輕量化的趨勢,大模型走向輕量化、并且在邊緣和終端進行部署,将成為值得關注的領域。 2023年10月,工業和資訊化部等六部門印發了《算力基礎設施高品質發展行動計劃》,要求到2025年國内算力達到300EFLOPS。其中,不僅包括雲端算力,也強調了邊緣算力的協同發展。“這對于國産AI晶片企業來說是一個積極的信号,意味着存在巨大的市場和豐富的應用場景。對于從業者來說,每個人都有機會在這個市場中分得一杯羹,為整個行業帶來利好”, 王少軍表示。 項之初認為,雖然國内AI産業目前是被客觀因素限制的狀态,并沒有完全展示出應有的潛力。但總體上看,因為龐大的應用場景和資料量,還是會讓中國成為全球唯二的AI産業市場,這個預期将會長期存在。總體上,大模型的下沉、在更多垂直領域的落地,将會給行業帶來新的增長契機,比如Transformer上車對自動駕駛的意義等趨勢都值得關注。 當然,AI晶片未來一兩年還是會有很多挑戰,比如資本市場過山車般的态度轉變,會讓很多暫時沒實作融資、前期擴張又過于激進的公司陷入困境。 “但硬币總有另外一面,市場态度的轉冷,能夠讓晶片人才安靜下來,而不是頻繁跳槽擡高短期收入,這對行業的健康發展,對有長期價值的公司反而是好事”,項之初補充。

寫在最後

自去年10月,美國釋出新規阻止英偉達向中國出售尖端AI晶片以來,英偉達陸續推出幾款“特供”晶片,以便在合規情況下繼續在中國的生意。 不過,幾家頭部雲廠商近期表明,訂購的晶片數量遠遠少于原計劃購買的已被禁的高性能晶片。知情人士稱,一方面,這些雲廠商将先進半導體訂單轉移給了本土晶片公司;另一方面,他們也在更多依賴公司内部開發的晶片。 短期來看,國産AI晶片與英偉達降級版晶片的性能差距在縮小,但論及中美晶片局勢實作逆轉還為時過早。正如幾位受訪人所指出,AI目前面臨的形勢是極其複雜的,既需要底層技術的根本變革,也需要軟硬體生态、上下遊供應鍊的合力發展,同時,也要充分看到AI大模型的發展方向,下沉到邊緣、端側是必然方向,也将給多元算力發展帶來全新機遇。

繼續閱讀