天天看點

小米入局AI賽道,小愛同學會更聰明嗎?

作者:未名科創
“13億參數的大模型,在手機上已經跑通了。” 還是熟悉的襯衫和牛仔褲,還是熟悉的湖北口音,在萬衆期待的2023年年度演講中,小米CEO雷軍終于宣布了小米的大模型戰略。

8月14日晚,小米集團創始人、董事長兼CEO雷軍在北京國家會議中心進行了第四次年度公開演講。在演講中,雷軍分享了他在武大、金山、小米的幾次關鍵成長經曆和感悟,并公布了小米的科技理念:選擇對人類文明有長期價值的技術領域,堅持長期持續投入。

在演講後的釋出會上,小米釋出了新一代折疊屏旗艦小米MIX Fold 3、Redmi K60至尊版兩款新品手機,以及平闆小米平闆6 Max 14、小米手環8 Pro,以及全新仿生四足機器人CyberDog2。

釋出會沒有透露關于小米汽車的資訊,不過對于另一個吸引無數關注的産品AI大模型,雷軍進行了簡單的介紹。

雷軍強調了小米全力擁抱大模型的戰略,并宣布小米的大模型已經在手機端初步跑通,小愛同學更新AI大模型,并開啟邀請測試。

小米大模型C-Eval 榜單排名第九

“13億參數的大模型,在手機上已經跑通了。” 還是熟悉的襯衫和牛仔褲,還是熟悉的湖北口音,在萬衆期待的2023年年度演講中,小米CEO雷軍終于宣布了小米的大模型戰略。

小米入局AI賽道,小愛同學會更聰明嗎?

雷軍梳理了小米在AI領域的投入。2016年,小米成立視覺AI團隊,而後更新為小米AI實驗室;2018年,成立AI影像算法團隊,主要服務于手機攝影攝像;2021年,成立小米機器人實驗室。

經過7年6次的擴充,小米AI團隊已有3000餘人的規模。其AI實驗室研究方向包括計算機視覺、聲學、語音、NLP、知識圖譜、機器學習、大模型、多模态等多個領域。

今年4月,小米組建AI大模型團隊,開始全面擁抱大模型。而今的第一個嘗試便是把智能語音助理“小愛同學”更新成大模型版本。

實際上,早在雷軍官宣前的8月11日,小米AI大模型 MiLM-6B 已經悄然出現在C-Eval、CMMLU 等大模型評測榜單,并獲得 C-Eval 榜單排名第九、在CMMLU榜單上排名第一的成績。

C-Eval榜單:C-Eval全球大模型綜合性考試測試榜。由清華大學、上海交通大學和愛丁堡大學合作建構的中文語言模型綜合性考試評估套件。考試覆寫人文、社科、理工、其他專業四個大方向,能夠更加全面地對模型中文處理能力進行評估。

小米入局AI賽道,小愛同學會更聰明嗎?

在C-Eval評估中,小米大模型的平均分為60.2,在所有大模型中排名第九;清華大學知識工程和資料挖掘小組(KEG)與智譜AI公司聯合研發的ChatGLM-6B以71.1分位居第一;GPT-4的中文表現以69.7分屈居第二;阿裡出品的大模型Qwen-7B以59.6分排在第十名。可以看出,小米大模型雖然排名第九,但和排名更為靠前的模型差别并不大。

從不同學科評分來看,MiLM-6B 模型目前在大多數文科科目中表現出較高準确度,但在“法學、數學、程式設計、機率論、離散數學”等涉及“抽象思維”的科目中,還有一定進步空間。

“社會科學”測試科目中,除教育學和地理外,MiLM-6B 在其他八個科目都獲得了較理想的準确率。在人文科學十餘個科目中,MiLM-6B 則在“曆史與法律”基礎上有着不錯表現。

不過,根據 GitHub 項目頁給出的資訊顯示,MiLM-6B參數規模僅為 64 億,是前十的大模型中訓練參數最低的。而這也意味着,在同量級參數的大模型中,MiLM-6B的分數排名第一。

适配手機,大模型夠“輕”是關鍵

在今年上半年,生成式AI大模型無疑是全球科技行業最關注的賽道。國内不少科技大廠早在3、4月就已經推出了對标ChatGPT的大模型産品,如百度的文心一言、阿裡的通義千問等。相比之下,小米的步子慢了不少。

此前,小米集團總裁盧偉冰表示,小米将積極擁抱大模型,但“(大模型)會與業務深度結合,但不會與OpenAI一樣獨立發展”;今年6月,小米AI實驗室主任王斌透露,小米将自主研發通用語言大模型,但不會單獨推出類似ChatGPT的産品。他表示,小米的首要目标是打造數百億參數的基礎模型,并将大模型應用于小愛同學、物聯網、自動駕駛和機器人等現有場景中。

本次釋出會證明這些言論不虛。雷軍在會中表示,目前小米正在研發一些新技術與産品,并會在打磨好後展示給大家。

足以看出,小米的AI戰略是十厘清晰的。研發大模型不是為了提供一款幫助人們寫文章、寫代碼、查找資料的聊天機器人,而是用大模型的能力去賦能小米原有的智能産品。

小米入局AI賽道,小愛同學會更聰明嗎?

雷軍在演講中宣布了第一個用小米大模型加成的産品:小愛同學。雷軍表示,全球每天有1.1億活躍使用者使用小愛同學,而小愛同學在接入大模型後,将擁有60億參數的運算能力,變得更聰明。

雷軍在談到小米大模型和其他大模型的差異時提出了“輕量化,本地部署”的概念。作為一家手機廠商,小米希望大模型可以本地部署,“在手機端就能用”。

據雷軍透露,早在年初,小米就已經在構想輕量化大模型。目前,小米自研的13億參數大模型已經在骁龍平台跑通,在部分場景上可以媲美行業60億參數的雲端大模型。

小藝 vs 小布 vs 小愛

大模型成為手機新戰場

在國内,人們的日常生活已經處處離不開智能手機。但今年ChatGPT等大模型的爆發,讓各大手機廠商意識到智能手機還可以更加智能,幫助人們做更多的事。

此前,各家的智能語音助手隻能完成簡單的任務,而有了大模型的“智力”,語音助手将變成真正的助理,可以和使用者随心所欲地自然交流,甚至還可能幫忙訂外賣、訂機票。

在這個領域,華為已經率先走出一步。華為在華為盤古L0基座大模型的基礎上,針對終端消費者場景建構了大量的場景資料與精調模型後的L1層對話模型,并将該模型用在了智慧助手小藝中。

小米入局AI賽道,小愛同學會更聰明嗎?

在大模型的加持下,小藝變得“更聰明、更能幹、更貼心”了。在華為開發者大會的示範中,使用者要求小藝“找一家附近評分高的海鮮餐廳,最好有适合四個人的優惠套餐”,小藝完全可以準确了解使用者意圖,并直接調用美團服務給找到相關餐廳;當使用者給小藝一張圖檔,跟小藝說,“我想參加技術論壇,導航去圖上的位址”,小藝可以準确識别圖檔中的位址資訊并打開導航App進行導航。

同樣在8月,另一家手機巨頭OPPO宣布将基于AndesGPT打造的全新小布助手,小布助手将具備AI大模型能力,擁有更強的對話能力和内容創作能力,可以根據需求的文案撰寫使用者需要的内容,而且歸納總結等 AI 能力也将極大增強。

AndesGPT是由OPPO安第斯智能雲團隊打造的基于混合雲架構的生成式大語言模型。曾一度在中文語言了解測評基準CLUE1.1總榜中排名第五,以及大規模知識圖譜問答KgCLUE1.0排行榜中排名第一。在今年6月的C-Eval評測榜單上,AndesGPT位列第五名。

可以說,國内的手機廠商在大模型領域已經“卷”起來了。最近,科技部落客“差評帝”在微網誌釋出了一個投票:誰家的智能助手最智能?其中,小米得到了最多的票數,華為排名第二。評論區不少人表示,“語音助手那還得是小愛”、“小愛确實靠譜”、“選小布的就離譜,小布就是一個呆子”……

不過人們的普遍印象很可能會在各家語音助手紛紛加持大模型後發生變化。據試用過新版小藝的使用者透露,用上了盤古大模型的小藝智商堪比7、8歲的孩子。而更新後的小愛和小布具體有多聰明,還需要更多使用者體驗了才知道。

作者|張礫礫

編輯|鞏周周

出品|未名科創

繼續閱讀