天天看點

終端AI分級标準落地,手機大模型“戰火”燒到了智能體

AI與作業系統的深度融合成為了過去一個月手機廠商對外火力的集中點,從蘋果的“Apple Intelligence”到榮耀的“AI智能體”、再從vivo的“PhoneGPT”到OPPO的“AIOS”,AI Agent智能體的競争開始成為衡量手機廠商技術能力的關鍵所在。

在AI手機“大亂鬥”的同時,相關的分級讨論也在進行。中國資訊通信研究院(以下簡稱“信通院”)10月18日聯合榮耀、vivo、華為等多家終端以及晶片公司釋出全球首份《終端智能化分級研究報告》,對AI手機的進化路徑給出明确方向。

“真假AI”手機至此有了評判的标準。Canalys分析師鐘曉磊對第一财經記者表示,現象級的AI原生應用仍有待出現,如果AI原生應用能重新塑造移動網際網路内容消費的現有習慣,那麼對于端側性能需求有望加速舊裝置的淘汰。

分級标準落地

在網際網路廠商仍在讨論誰是“中國版ChatGPT”時候,手機廠商以及終端産業鍊玩家也在尋找大模型為産業帶來的新機會,試圖從中分得一杯羹。但當聲量聚集時,雜音以及複雜的話術使得“AI手機”成為了一個廣泛且模糊的概念。

“能夠提供生成式AI能力的手機并不等于AI手機,甚至相去甚遠。”一位頭部國産手機廠商負責人此前對記者表示,做AI手機想像快餐一樣,反倒會适得其反。

什麼是AI手機?如何定義AI手機的能力?能消圖的就是AI手機了嗎?面對這些問題,中國資訊通信研究院在最新釋出的報告中提到,終端智能化水準目前分為L1-L5五個等級,不同等級對應人、終端不同的角色定位,智能化等級越高,終端在任務完成過程中的自主參與度越高,人的參與度越低。

換言之,擁有上述分級能力的某種程度上可以稱為具有AI能力的終端産品,但之間的能力差異非常大。

以出行場景為例,在L1級别中,使用者輸入資訊“幫我預訂一張北京到上海的機票”,終端可識别并執行指令,打開訂票軟體并輸入相應内容,但需要使用者自行浏覽搜尋結果,選擇合适航班,填寫乘客資訊後自己完成支付。而到了L2,終端可以根據使用者偏好打開訂票軟體自動搜尋機票,L3場景中,更是能提供制定方案。L4場景則會根據使用者的日常浏覽動作識别出潛在的旅遊需求并指定方案。到了L5級别,在沒有訂票動作的情況下,可以根據使用者的日常資訊推測出旅遊的想法,并規劃目的地以及方案。

終端AI分級标準落地,手機大模型“戰火”燒到了智能體

可以看到,L1級(智能響應級)和L2級(智能輔助級)具備一定的智能化,可以基于使用者偏好完成單類型任務。到了L3級(智能助理級)以及L4(智能協同級),則逐漸從感覺識别複雜意圖到識别潛在意圖。而L5級(自主智能級)則具備全面的智能化,基于全場景進行自主規劃完成全類型任務。

但從L1到L5無疑是一項複雜的系統工程,需要産業各方協同合作、優勢互補,共同推動終端智能化水準提升。而從目前手機廠商布局的方向來看,各有側重點。

今年9月,榮耀在IFA展上正式釋出了全球首個跨應用開放生态智能體“榮耀AI智能體”,基于對使用者習慣的了解以及目前使用情景,可以了解使用者需求并迅速作出響應,執行、調取手機各類資源與三方服務。

榮耀CEO趙明表示,榮耀AI智能體瞄向的是“手機自動駕駛”,AI Agent不僅能調用自家系統自帶的服務,還面向所有第三方服務開放合作,榮耀要做的是“平台級”的AI終端。

OPPO也在近日的開發者大會上展示了AI搜尋的能力。OPPO軟體工程事業部總裁唐凱表示,AIOS将經曆三個階段,從系統應用AI化到系統AI化,再到AI即系統。換言之,OPPO尋求的是先從底層系統與AI的相融合,技術側更偏向于自身系統的提升。

vivo的方向與OPPO類似。vivo AI全球研究院院長周圍對記者表示,今年的核心是AI重構系統體驗,不會局限在某個單一功能或者應用上,但具體會用什麼樣的方案,還在摸索。

蘋果在此前也展示了AI手機的功能,比如與蘋果語音助手Siri的結合,但從與OpenAI等大模型公司的合作看,蘋果在AI上的方向也傾向于做平台方。

“戰火”燒到了應用層

無論采取什麼樣的路徑,AI在應用層面的真正競争已經開始。在完成了算力、大模型基礎建構的思考後,手機廠商中誰能更快地從L1走向L5,将決定未來在手機行業的身位。

具體來看,目前蘋果的AI功能主要集中在主流應用中,從相機、相冊、月曆、備忘錄,到浏覽器、電子郵件,系統中幾乎所有原生應用都将被AI賦能。此外,在蘋果智能的加持下,蘋果語音助手Siri的表現顯著增強,并且使用者在使用Siri和一系列應用期間,可以要求系統調用ChatGPT來進行回應。

與蘋果相比,國内手機廠商則開始給出了更加具體的AI手機應用場景。

不久前,榮耀陸續公布了“一句話點外賣”“一句話轉發文檔”等AI功能。以“一句話轉發文檔”為例,使用者向手機發出語音指令,與手機系統融合的榮耀AI智能體在了解使用者需求後,按照“搜尋、選擇、分享”的步驟發送檔案,支援跳轉至微信App并選擇對應聯系人。

“AI智能體不僅能夠聽懂你的語義,關鍵是它可以了解螢幕上實時回報的資訊,并模仿人的了解來進行相應操作。”趙明表示,更為複雜的AI手機可以在第三方應用内模仿人來認知、了解應用的内容,并且模仿人來進行相應的操作。

OPPO則在開發者大會上推出了SenseNow架構,通過小布助手支援連續對話、景點識别。OPPO稱,場景方向上,目标是讓AI實作“聽得清、看得懂、做得快”多模态直覺互動,進而了解使用者的複雜意圖,完成跨應用的操作,

vivo則将更多的能力下放至“小模型”上,比如圖像模型、聲音模型。

比起什麼都做,周圍認為需要基于現有的場景做AI能力疊加才有發展的可能。“比如說我們今年做了11種模型,第一版做了20多種語言,明年40種,後年可能是60種、80種,80種語言隻要一個模型就可以搞定,當這種東西越來越多的時候,這個時候的手機就會出現體驗上的差距。”周圍說。

提起和蘋果AI在應用層的差别,趙明認為,目前國内手機廠商的作業系統已經具備了更強大的能力。“廠商過去需要跟着安卓的節奏走,但現在安卓承擔的更像是核心或者架構的作用。現在各家廠商都在系統層面投入,探索場景化的具體落地方案。在AI加持之後作業系統走向個人化,其實就是裝置的千人千面。”

Counterpoint Research智能手機行業分析師Archie對記者表示,手機原來隻是個工具,但在未來會變成了一個外腦,不再隻是一個硬體狀态。

Archie認為,應用場景探索中,多模态的輸入和輸出能力相結合,可以極大強化智能手機的生産力工具屬性,既可以基于多種形式的輸入資訊,生成使用者需要的圖表、文本、音樂、圖檔甚至是視訊,也可以對輸入的圖檔、視訊進行編輯,這些新的技術變革能夠逐漸激發消費市場新的需求。

但也可以看到,硬體層面的AI晶片推理能力以及軟體層面的互動方式都對AI手機本身提出了更高的要求,成本和技術方案都來到了關鍵節點,而除了硬體外,各大手機廠商還需要圍繞如何利用AI為使用者提供個性化的服務展開。

(本文來自第一财經)

繼續閱讀