天天看点

小米入局AI赛道,小爱同学会更聪明吗?

作者:未名科创
“13亿参数的大模型,在手机上已经跑通了。” 还是熟悉的衬衫和牛仔裤,还是熟悉的湖北口音,在万众期待的2023年年度演讲中,小米CEO雷军终于宣布了小米的大模型战略。

8月14日晚,小米集团创始人、董事长兼CEO雷军在北京国家会议中心进行了第四次年度公开演讲。在演讲中,雷军分享了他在武大、金山、小米的几次关键成长经历和感悟,并公布了小米的科技理念:选择对人类文明有长期价值的技术领域,坚持长期持续投入。

在演讲后的发布会上,小米发布了新一代折叠屏旗舰小米MIX Fold 3、Redmi K60至尊版两款新品手机,以及平板小米平板6 Max 14、小米手环8 Pro,以及全新仿生四足机器人CyberDog2。

发布会没有透露关于小米汽车的信息,不过对于另一个吸引无数关注的产品AI大模型,雷军进行了简单的介绍。

雷军强调了小米全力拥抱大模型的战略,并宣布小米的大模型已经在手机端初步跑通,小爱同学升级AI大模型,并开启邀请测试。

小米大模型C-Eval 榜单排名第九

“13亿参数的大模型,在手机上已经跑通了。” 还是熟悉的衬衫和牛仔裤,还是熟悉的湖北口音,在万众期待的2023年年度演讲中,小米CEO雷军终于宣布了小米的大模型战略。

小米入局AI赛道,小爱同学会更聪明吗?

雷军梳理了小米在AI领域的投入。2016年,小米成立视觉AI团队,而后升级为小米AI实验室;2018年,成立AI影像算法团队,主要服务于手机摄影摄像;2021年,成立小米机器人实验室。

经过7年6次的扩展,小米AI团队已有3000余人的规模。其AI实验室研究方向包括计算机视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态等多个领域。

今年4月,小米组建AI大模型团队,开始全面拥抱大模型。而今的第一个尝试便是把智能语音助理“小爱同学”升级成大模型版本。

实际上,早在雷军官宣前的8月11日,小米AI大模型 MiLM-6B 已经悄然出现在C-Eval、CMMLU 等大模型评测榜单,并获得 C-Eval 榜单排名第九、在CMMLU榜单上排名第一的成绩。

C-Eval榜单:C-Eval全球大模型综合性考试测试榜。由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。考试覆盖人文、社科、理工、其他专业四个大方向,能够更加全面地对模型中文处理能力进行评估。

小米入局AI赛道,小爱同学会更聪明吗?

在C-Eval评估中,小米大模型的平均分为60.2,在所有大模型中排名第九;清华大学知识工程和数据挖掘小组(KEG)与智谱AI公司联合研发的ChatGLM-6B以71.1分位居第一;GPT-4的中文表现以69.7分屈居第二;阿里出品的大模型Qwen-7B以59.6分排在第十名。可以看出,小米大模型虽然排名第九,但和排名更为靠前的模型差别并不大。

从不同学科评分来看,MiLM-6B 模型目前在大多数文科科目中表现出较高准确度,但在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间。

“社会科学”测试科目中,除教育学和地理外,MiLM-6B 在其他八个科目都获得了较理想的准确率。在人文科学十余个科目中,MiLM-6B 则在“历史与法律”基础上有着不错表现。

不过,根据 GitHub 项目页给出的信息显示,MiLM-6B参数规模仅为 64 亿,是前十的大模型中训练参数最低的。而这也意味着,在同量级参数的大模型中,MiLM-6B的分数排名第一。

适配手机,大模型够“轻”是关键

在今年上半年,生成式AI大模型无疑是全球科技行业最关注的赛道。国内不少科技大厂早在3、4月就已经推出了对标ChatGPT的大模型产品,如百度的文心一言、阿里的通义千问等。相比之下,小米的步子慢了不少。

此前,小米集团总裁卢伟冰表示,小米将积极拥抱大模型,但“(大模型)会与业务深度结合,但不会与OpenAI一样独立发展”;今年6月,小米AI实验室主任王斌透露,小米将自主研发通用语言大模型,但不会单独推出类似ChatGPT的产品。他表示,小米的首要目标是打造数百亿参数的基础模型,并将大模型应用于小爱同学、物联网、自动驾驶和机器人等现有场景中。

本次发布会证实这些言论不虚。雷军在会中表示,目前小米正在研发一些新技术与产品,并会在打磨好后展示给大家。

足以看出,小米的AI战略是十分清晰的。研发大模型不是为了提供一款帮助人们写文章、写代码、查找资料的聊天机器人,而是用大模型的能力去赋能小米原有的智能产品。

小米入局AI赛道,小爱同学会更聪明吗?

雷军在演讲中宣布了第一个用小米大模型加成的产品:小爱同学。雷军表示,全球每天有1.1亿活跃用户使用小爱同学,而小爱同学在接入大模型后,将拥有60亿参数的运算能力,变得更聪明。

雷军在谈到小米大模型和其他大模型的差异时提出了“轻量化,本地部署”的概念。作为一家手机厂商,小米希望大模型可以本地部署,“在手机端就能用”。

据雷军透露,早在年初,小米就已经在构想轻量化大模型。目前,小米自研的13亿参数大模型已经在骁龙平台跑通,在部分场景上可以媲美行业60亿参数的云端大模型。

小艺 vs 小布 vs 小爱

大模型成为手机新战场

在国内,人们的日常生活已经处处离不开智能手机。但今年ChatGPT等大模型的爆发,让各大手机厂商意识到智能手机还可以更加智能,帮助人们做更多的事。

此前,各家的智能语音助手只能完成简单的任务,而有了大模型的“智力”,语音助手将变成真正的助理,可以和用户随心所欲地自然交流,甚至还可能帮忙订外卖、订机票。

在这个领域,华为已经率先走出一步。华为在华为盘古L0基座大模型的基础上,针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了智慧助手小艺中。

小米入局AI赛道,小爱同学会更聪明吗?

在大模型的加持下,小艺变得“更聪明、更能干、更贴心”了。在华为开发者大会的演示中,用户要求小艺“找一家附近评分高的海鲜餐厅,最好有适合四个人的优惠套餐”,小艺完全可以准确理解用户意图,并直接调用美团服务给找到相关餐厅;当用户给小艺一张图片,跟小艺说,“我想参加技术论坛,导航去图上的地址”,小艺可以准确识别图片中的地址信息并打开导航App进行导航。

同样在8月,另一家手机巨头OPPO宣布将基于AndesGPT打造的全新小布助手,小布助手将具备AI大模型能力,拥有更强的对话能力和内容创作能力,可以根据需求的文案撰写用户需要的内容,而且归纳总结等 AI 能力也将极大增强。

AndesGPT是由OPPO安第斯智能云团队打造的基于混合云架构的生成式大语言模型。曾一度在中文语言理解测评基准CLUE1.1总榜中排名第五,以及大规模知识图谱问答KgCLUE1.0排行榜中排名第一。在今年6月的C-Eval评测榜单上,AndesGPT位列第五名。

可以说,国内的手机厂商在大模型领域已经“卷”起来了。最近,科技博主“差评帝”在微博发布了一个投票:谁家的智能助手最智能?其中,小米得到了最多的票数,华为排名第二。评论区不少人表示,“语音助手那还得是小爱”、“小爱确实靠谱”、“选小布的就离谱,小布就是一个呆子”……

不过人们的普遍印象很可能会在各家语音助手纷纷加持大模型后发生变化。据试用过新版小艺的用户透露,用上了盘古大模型的小艺智商堪比7、8岁的孩子。而升级后的小爱和小布具体有多聪明,还需要更多用户体验了才知道。

作者|张砾砾

编辑|巩周周

出品|未名科创

继续阅读