天天看点

一分钟!这个AI创造力爆表了……

一分钟完成服装、家具的设计,成为设计师的有力助手——

这是业界最大的中国多模态预训练AI模型,由阿里巴巴和清华大学联合发布:M6。

M6模型的规模为1000亿,是多模态预训练历史上最大的模型。以图像生成的应用为例,M6可以在服装、鞋类、家具、珠宝、书籍等30多个类别的物品中设计图像,并在至少一分钟内完成作品的创作。

一分钟!这个AI创造力爆表了……

M6如何快速精细地设计?

由于M6是一种"多模态预训练模型",作为一种新的AI训练方法,它突破了传统深度学习方法的瓶颈,使AI具有认知能力。

M6的训练路径是:首先,自动学习大量的语言文本和图像数据,记忆和理解人类的先验知识,然后进一步研究专业领域的信息,使AI同时掌握常识和专业知识。

M6的突破源于许多潜在的技术创新。基于自研鲸鱼分布式框架,阿里巴巴研究团队将参数尺度同时扩大到数千亿美元,采用大规模数据并行和模型并行,训练速度提升了10倍以上,在短短1-2天内完成数亿次数据预训练。

一分钟!这个AI创造力爆表了……

阿里M6车型根据文字内容自动设计图片

此外,M6模型首次将多模态预训练模型应用于基于文本的图像生成任务,结合矢量量化,针对Web学习文本和图像编码的协同建模生成任务,从而产生高清和详细的图像。

多模态预训练是下一代人工智能的基础,M6模型实现了训练效率和生成精度等诸多突破,是中国许多多模态下游任务的最优模型。

杨红霞,阿里巴巴达摩研究所智能计算实验室高级算法专家

作为中国首批投资认知智能研究的科技公司之一,阿里巴巴在认知智能领域的30多项研究成果均获得国际顶级会议。

接下来,研究团队将开发更大规模的多模态多模态预训练模型,不断突破计算力和预训练模型的极限,最终实现一般领域的高质量泛内容生成。

继续阅读