一分鐘完成服裝、家具的設計,成為設計師的有力助手——
這是業界最大的中國多模态預訓練AI模型,由阿裡巴巴和清華大學聯合釋出:M6。
M6模型的規模為1000億,是多模态預訓練曆史上最大的模型。以圖像生成的應用為例,M6可以在服裝、鞋類、家具、珠寶、書籍等30多個類别的物品中設計圖像,并在至少一分鐘内完成作品的創作。

M6如何快速精細地設計?
由于M6是一種"多模态預訓練模型",作為一種新的AI訓練方法,它突破了傳統深度學習方法的瓶頸,使AI具有認知能力。
M6的訓練路徑是:首先,自動學習大量的語言文本和圖像資料,記憶和了解人類的先驗知識,然後進一步研究專業領域的資訊,使AI同時掌握常識和專業知識。
M6的突破源于許多潛在的技術創新。基于自研鲸魚分布式架構,阿裡巴巴研究團隊将參數尺度同時擴大到數千億美元,采用大規模資料并行和模型并行,訓練速度提升了10倍以上,在短短1-2天内完成數億次資料預訓練。
阿裡M6車型根據文字内容自動設計圖檔
此外,M6模型首次将多模态預訓練模型應用于基于文本的圖像生成任務,結合矢量量化,針對Web學習文本和圖像編碼的協同模組化生成任務,進而産生高清和詳細的圖像。
多模态預訓練是下一代人工智能的基礎,M6模型實作了訓練效率和生成精度等諸多突破,是中國許多多模态下遊任務的最優模型。
楊紅霞,阿裡巴巴達摩研究所智能計算實驗室進階算法專家
作為中國首批投資認知智能研究的科技公司之一,阿裡巴巴在認知智能領域的30多項研究成果均獲得國際頂級會議。
接下來,研究團隊将開發更大規模的多模态多模态預訓練模型,不斷突破計算力和預訓練模型的極限,最終實作一般領域的高品質泛内容生成。