天天看点

国产“ChatGPT”自我介绍合集,谁能笑到最后?

2023 年是全球人工智能大模型集中爆发的一年,由 ChatGPT 引领的生成式人工智能(AIGC)应用席卷全球,为全球人工智能产业落地开辟了一条全新的赛道,国内外各大科技公司、科研机构前赴后继,涌入这片市场前景广阔的商业蓝海。

中国科学技术信息研究所所长赵志耘表示,中国大模型的各种技术路线也在并行突破,特别是在自然语言理解、机器视觉、多模态等方面,出现了多个在行业有影响力的大模型。据不完全统计,目前中国 10 亿级参数规模以上的大模型已发布 79 个。

下面就让我们来盘点目前国内已经发布的人工智能大模型及其衍生产品。

MOSS

国产“ChatGPT”自我介绍合集,谁能笑到最后?

MOSS 由复旦大学自然语言处理实验室邱锡鹏教授团队发布,是国内首个由高校团队研发的对话式大型语言模型,可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。

作为国内最早发布的类 ChatGPT 产品,MOSS 团队表示它还是一个非常不成熟的模型,距离 ChatGPT 还有很长的路需要走。

文心大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

国内企业中最早出面“迎战” ChatGPT 的则是百度。百度推出的文心一言继承了其多年来在搜索引擎和 AI 领域积累的技术优势。文心一言的训练采用了和传统的搜索引擎不同的方法,它基于百度自研深度学习框架飞桨(PaddlePaddle)、文心大模型的技术研发,通过引入多层的 Transformer 网络来学习语言知识。与传统的基于规则和模型的方法相比,文心一言可以更好地适应自然语言的复杂性,并且可以在大规模的语料库上进行训练,从而获得更好的性能。

尽管文心一言发布会以录屏的形式展现产品遭到诟病,产品早期的表现也不尽如人意,但经过一段时间的公测迭代,加上百度在中文搜索引擎领域得天独厚的数据资源优势,目前的文心一言在中文处理方面已接近 ChatGPT 3.0 的能力,未来可期。

360 GPT 大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

360 融合自研的一系列大模型推出了两款产品,分别是 ChatBot 产品“360 智脑”和 AI 图像生成工具“360 鸿图”。360 智脑集合了 360CV 大模型、360GPT 大模型、360GLM 大模型、360 多模态大模型的技术能力,实现了语言理解、图像识别、自然语言处理、问答系统领域的深度应用。

目前,“360 智脑”结合 360 搜索、智能硬件等优势场景的落地应用已陆续成熟,并开放内测。其中“图查查”获评工信部重点实验室“生成式人工智能技术和应用优秀案例”,360 集团同时受邀参与中国大模型应用标准编写。

日日新大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

日日新(SenseNova)大模型是由商汤科技研发的大模型体系,除了千亿参数的自然语言处理大模型外,还包括文生图、感知模型标注、以及模型研发等功能。基于这些不同的能力,商汤分别推出了中文语言处理 ChatBot 产品“商量”,文生图产品“秒画”,数字人视频生成产品“如影”,3D 场景生成产品“琼宇”,3D 模型生成产品“格物”,全方位进军 AIGC 领域。

通义大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

通义大模型由阿里巴巴旗下科研机构达摩院研发,使用了深度学习技术,循环神经网络(RNN)和长短时记忆网络(LSTM),注意力机制和迁移学习等技术。其训练数据包含了大量的语言和文本数据,包括但不限于:中文、英文、日文、法文、西班牙文、德文等多种语言的文本数据;文学、历史、科学、艺术等各类话题的文本数据;以及各类专业知识和技术文档等。阿里云 CEO 张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、淘宝、钉钉、天猫精灵、闲鱼、盒马等产品。

6月1日,阿里云宣布聚焦音视频内容的 AI 新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。通义听悟接入了通义千问大模型的理解与摘要能力,可帮助用户随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取 PPT 等。

天工大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

“天工”由昆仑万维和奇点智源联合研发,是昆仑万维继 AI 绘画产品“天工巧绘”后的又一款生成式 AI 产品。“天工”通过自然语言与用户进行问答式交互,AI 生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。

讯飞星火认知大模型

国产“ChatGPT”自我介绍合集,谁能笑到最后?

作为在国内深耕智能语音、自然语言处理和计算机视觉领域的人工智能上市公司,科大讯飞推出的讯飞星火认知大模型首要目标就是对标 ChatGPT 和 GPT-4。讯飞星火聚焦多角色多风格长文本生成、任意任务的对话式理解、海量信息的知识问答、基于思维链的逻辑推理、数学能力、代码理解与生成能力几个方面实现技术突破。据悉,科大讯飞在6月9日还将进一步实现星火 APP 等多个产品级应用发布。

除上述以聊天机器人形式落地的产品外,还有聚焦工业端 AI 赋能的华为“盘古”大模型,专注跨模态视频检索能力的腾讯“混元”大模型等数十个大模型也在今年陆续发布。

结语

尽管目前国内大模型产品如雨后春笋般涌现,但业界面临的问题也较为突出。中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》指出,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。从研发主体分布看,大学、科研机构、企业等不同创新主体都在积极参与大模型研发,但学术界与产业界之间的联合研发仍不足。

针对当前国内大模型发展情况,赵志耘建议,未来大陆还需加强资源和研发力量统筹,鼓励大模型开源开放,强化国际合作,积极参与全球人工智能治理,加快人工智能治理原则和伦理规范在大模型研发全链条落地生根,以进一步促进大模型有序发展。

欢迎关注「新数潮」公众号,和我们一起了解数字经济!

一周资讯 | 中央政治局会议指出要重视通用人工智能发展

ChatGPT 掀起 AI 大模型风潮

继续阅读