天天看點

大模型落地手機晶片!阿裡雲牽手聯發科趟路子,低迷手機市場等風來

大模型落地手機晶片!阿裡雲牽手聯發科趟路子,低迷手機市場等風來

大模型落地手機晶片!阿裡雲牽手聯發科趟路子,低迷手機市場等風來

AI大模型在手機終端上的部署日益提速。

3月28日,阿裡雲與聯發科聯合宣布,通義千問18億、40億參數大模型已成功部署進天玑9300移動平台。據悉,這是通義大模型首次完成晶片級的軟硬适配,同時意味着Model-on-Chip的探索正式從驗證走向商業化落地新階段。

在這背後,本身擁有計算能力的終端被認為是AI大模型落地的重要場景之一,特别是使用頻率極高的手機。與此同時,外界也期待AI大模型能攪動疲軟許久的手機市場。

端側大模型加速

在手機終端部署AI大模型,手機算力決定了大模型的表現。

記者從阿裡雲方面了解到,通義千問18億參數開源大模型,在多個權威測試集上性能表現遠超此前SOTA模型,且推理2048 token最低僅用1.8G記憶體,是一款低成本、易于部署、商業化友好的小尺寸模型。天玑9300內建MediaTek第七代AI處理器APU790,生成式AI處理速度是上一代AI處理器的8倍。

此外,阿裡雲方面還告訴《華夏時報》記者,雙方團隊也已完成了通義千問40億參數大模型與天玑9300的适配,未來還将基于天玑适配70億等更多尺寸大模型,“打樣”并支援開發更多AI智能體及應用。“不是參數越大越好,适配最重要。”阿裡雲相關人士告訴記者。

據記者了解,通義千問是阿裡雲自研的基礎大模型,迄今已推出千億參數的2.0版本以及開源的720億、140億、70億、40億、18億、5億參數等尺寸,以及視覺了解模型Qwen-VL、音頻大模型Qwen-Audio等多模态大模型。

有業内人士在跟記者交流時認為,利用終端算力進行AI推理,可大幅降低推理成本、保證資料安全并提升AI響應速度,讓大模型可以更好地為使用者提供個性化體驗。

3月24日,上海人工智能實驗室領軍科學家林達華在2024全球開發者先鋒大會大模型前沿論壇也提出,伴随着雲側計算的指數級增長,端側計算将迎來黃金增長期。目前,很多模型越做越小,可以直接進入手機運用。為此,手機算力也需不斷增長。未來,雲端協同将成為重要趨勢,大模型使用者量的增長将主要依靠端側。

不過需要提及的是,在手機端部署大模型并不容易。

據記者了解,要将大模型部署并運作在終端,需完成從底層晶片到上層作業系統及應用開發的軟硬一體深度适配,存在技術未打通、算子不支援、開發待完善等諸多挑戰。

阿裡巴巴通義實驗室業務負責人徐棟介紹稱,阿裡雲與聯發科在模型瘦身、工具鍊優化、推理優化、記憶體優化、算子優化等多個次元展開合作,實作了基于AI處理器的高效異構加速,真正把大模型“裝進”并運作在手機晶片中,給業界成功打樣端側AI的Model-on-Chip部署新模式。

攪動低迷手機市場

作為全球智能手機晶片出貨量最高的半導體公司,聯發科與阿裡雲在端側大模型的合作,對手機市場影響不言而喻。Canalys最新資料顯示,其2023年第4季度出貨超1.17億部,蘋果以7800萬出貨量位居第二,高通以6900萬出貨量位居第三。

事實上不隻聯發科,今年3月,高通也宣布推出第三代骁龍8s移動平台,支援100億參數級别的大語言模型,也能夠支援多模态生成式AI模型,由小米Civi 4 Pro全球首發。

手機終端廠商布局AI大模型更早。據記者了解,去年10月釋出的小米14以及14Pro,已經部署了AI端側大模型。今年2月,OPPO對外釋出了自己的1+N智能體生态戰略,魅族也在宣布進行戰略調整,停止傳統“智能手機”新項目的開發,全力投入新一代AI裝置。

在手機産業鍊都全力AI背後,TechInsights給出的資料顯示,2023年全球智能手機的換機率可能會跌至23.5%(換機周期為51個月)的最低點。

IDC釋出的《AI手機白皮書》預計,2024年起新一代AI手機将帶動新一輪換機潮,2024年全球新一代AI手機出貨量将達到1.7億部,約占智能機整體出貨量的15%,具體到中國市場,IDC也預計,随着新的晶片和使用者使用場景的快速疊代,新一代AI手機在2027年将達到1.5億台,市場佔有率超過50%。

在此之前,手機市場已經低迷太久。就在剛過去的2023年,IDC資料顯示,當年全球智能機出貨量同比下降3.2%至11.7億部,為十年來最低,當年中國智能機出貨量約2.71億台,同比下降5%,也創下近10年以來最低出貨量。

AI大模型被期待能成為刺激手機市場增長的強心針。不過IDC中國進階分析師郭天翔對《華夏時報》記者指出,随着晶片的更新,會有更多手機從算力上可以支援大模型,但對于消費者而言,短時間内AI大模型尚不會成為剛需,難以成為推動消費者換機主推力。

責任編輯:黃興利 主編:寒豐

繼續閱讀