ChatGPT在全球掀起AI大模型的浪潮。在美国,以OpenAI、Anthropic等初创企业和以微软、Google为代表的科技巨头带领着美国在AI大模型的道路上蒙眼狂奔,最大参数已卷到5620亿。在中国,美团王慧文、阿里贾扬清、前搜狗CEO王小川、前京东AI掌门人周伯文等众多早已功成名就的科技大佬再次披挂。
新计算时代呼之欲出,储备算力成为必选项
随着数字技术全面融入人类经济社会发展的方方面面,算力早已无处不在。今年以来, ChatGPT火爆全球,其幕后的核心引擎——算力更是走到了聚光灯下,成为各界热议的焦点,也是此次世界人工智能大会的主题之一。
报告指出,当前,算力正由终端计算等需求驱动的“被动式”发展,转向促进AI大模型训练、实现通用人工智能、超越经典计算等代表的“主动式”发展。新硬件、新架构竞相涌现,现有芯片、操作系统、应用软件等都可能被推翻重来,新计算时代呼之欲出。
深度学习出现之前,用于AI训练的算力增长大约每20个月翻一番,基本符合摩尔定律;之后,用于AI训练的算力大约每6个月翻一番;2012年后,全球头部AI模型训练算力需求更是加速到每3-4个月翻一番,即平均每年算力增长幅度达到惊人的10倍。
目前大模型发展如火如荼,训练算力需求有望扩张到原来的10到100倍,算力需求的指数级增长曲线将更加陡峭。正如此前“ChatGPT之父”、OpenAI首席执行官山姆·奥特曼在社交媒体称,一个全新的摩尔定律可能很快就会出现。
发展热潮,从百模大战到万模群舞
2023年以来,最热门的话题当属人工智能大模型。随着ChatGPT掀起大模型的发展热潮,现在已有80余个大模型公开发布。在日前召开的“2023全球数字经济大会人工智能高峰论坛”上,360公司创始人周鸿祎甚至预测,未来可能不是百模大战,而是万模群舞。
大陆在大模型产业领域,百度、阿里、华为等公司均有较早的布局。2023年ChatGPT掀起浪潮时,百度3月份发布大语言模型“文心一言”,成为大陆首个类ChatGPT产品。之后,多家企业发布的大模型争相亮相。
截至7月3日,大陆10亿级参数规模以上大模型已超80个。这其中既有互联网巨头发布的产品,也有旷视科技、商汤科技、科大讯飞等人工智能公司,还有光年之外、百川智能等初创企业,以及中科院自动化所、上海人工智能实验室等科研院。
随着越来越多大模型产品问世,商业化落地问题也被随之提出。事实上,也只有实现了商业化落地,才能确保大模型产品的持续发展。衔远科技创始人周伯文就指出:“中国企业尚未普遍通过人工智能技术实现大规模营收增长和利润贡献,我们应该面对这个现实。”
“大模型最好的应用场景就是帮助企业去做多环节、多部门、多流程的知识管理,把财务、差旅和职级体系全部打通,完成各种资质管理、市场洞察和客户交互,更多的是售前跟客户的互动,为员工提供生产力工具。”
实际上,目前已经有人开始讨论“百模大战”是否存在重复建设的问题了,并预测未来只有少数强者能够胜出,并生存下来。但是,无论未来有多少家企业能够生存,只有能够真正实现应用,为社会带来价值的企业,才能在竞争中获得发展。