2023 年是全球人工智能大模型集中爆發的一年,由 ChatGPT 引領的生成式人工智能(AIGC)應用席卷全球,為全球人工智能産業落地開辟了一條全新的賽道,國内外各大科技公司、科研機構前赴後繼,湧入這片市場前景廣闊的商業藍海。
中國科學技術資訊研究所所長趙志耘表示,中國大模型的各種技術路線也在并行突破,特别是在自然語言了解、機器視覺、多模态等方面,出現了多個在行業有影響力的大模型。據不完全統計,目前中國 10 億級參數規模以上的大模型已釋出 79 個。
下面就讓我們來盤點目前國内已經釋出的人工智能大模型及其衍生産品。
MOSS
MOSS 由複旦大學自然語言處理實驗室邱錫鵬教授團隊釋出,是國内首個由高校團隊研發的對話式大型語言模型,可執行對話生成、程式設計、事實問答等一系列任務,打通了讓生成式語言模型了解人類意圖并具有對話能力的全部技術路徑。
作為國内最早釋出的類 ChatGPT 産品,MOSS 團隊表示它還是一個非常不成熟的模型,距離 ChatGPT 還有很長的路需要走。
文心大模型
國内企業中最早出面“迎戰” ChatGPT 的則是百度。百度推出的文心一言繼承了其多年來在搜尋引擎和 AI 領域積累的技術優勢。文心一言的訓練采用了和傳統的搜尋引擎不同的方法,它基于百度自研深度學習架構飛槳(PaddlePaddle)、文心大模型的技術研發,通過引入多層的 Transformer 網絡來學習語言知識。與傳統的基于規則和模型的方法相比,文心一言可以更好地适應自然語言的複雜性,并且可以在大規模的語料庫上進行訓練,進而獲得更好的性能。
盡管文心一言釋出會以錄屏的形式展現産品遭到诟病,産品早期的表現也不盡如人意,但經過一段時間的公測疊代,加上百度在中文搜尋引擎領域得天獨厚的資料資源優勢,目前的文心一言在中文處理方面已接近 ChatGPT 3.0 的能力,未來可期。
360 GPT 大模型
360 融合自研的一系列大模型推出了兩款産品,分别是 ChatBot 産品“360 智腦”和 AI 圖像生成工具“360 鴻圖”。360 智腦集合了 360CV 大模型、360GPT 大模型、360GLM 大模型、360 多模态大模型的技術能力,實作了語言了解、圖像識别、自然語言處理、問答系統領域的深度應用。
目前,“360 智腦”結合 360 搜尋、智能硬體等優勢場景的落地應用已陸續成熟,并開放内測。其中“圖查查”獲評工信部重點實驗室“生成式人工智能技術和應用優秀案例”,360 集團同時受邀參與中國大模型應用标準編寫。
日日新大模型
日日新(SenseNova)大模型是由商湯科技研發的大模型體系,除了千億參數的自然語言處理大模型外,還包括文生圖、感覺模型标注、以及模型研發等功能。基于這些不同的能力,商湯分别推出了中文語言處理 ChatBot 産品“商量”,文生圖産品“秒畫”,數字人視訊生成産品“如影”,3D 場景生成産品“瓊宇”,3D 模型生成産品“格物”,全方位進軍 AIGC 領域。
通義大模型
通義大模型由阿裡巴巴旗下科研機構達摩院研發,使用了深度學習技術,循環神經網絡(RNN)和長短時記憶網絡(LSTM),注意力機制和遷移學習等技術。其訓練資料包含了大量的語言和文本資料,包括但不限于:中文、英文、日文、法文、西班牙文、德文等多種語言的文本資料;文學、曆史、科學、藝術等各類話題的文本資料;以及各類專業知識和技術文檔等。阿裡雲 CEO 張勇表示,阿裡巴巴所有産品未來将接入“通義千問”大模型,進行全面改造,包括天貓、淘寶、釘釘、天貓精靈、閑魚、盒馬等産品。
6月1日,阿裡雲宣布聚焦音視訊内容的 AI 新品“通義聽悟”正式上線,成為國内首個開放公測的大模型應用産品。通義聽悟接入了通義千問大模型的了解與摘要能力,可幫助使用者随時随地高效完成對音視訊内容的轉寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取 PPT 等。
天工大模型
“天工”由昆侖萬維和奇點智源聯合研發,是昆侖萬維繼 AI 繪畫産品“天工巧繪”後的又一款生成式 AI 産品。“天工”通過自然語言與使用者進行問答式互動,AI 生成能力可滿足文案創作、知識問答、代碼程式設計、邏輯推演、數理推算等多元化需求。
訊飛星火認知大模型
作為在國内深耕智能語音、自然語言處理和計算機視覺領域的人工智能上市公司,科大訊飛推出的訊飛星火認知大模型首要目标就是對标 ChatGPT 和 GPT-4。訊飛星火聚焦多角色多風格長文本生成、任意任務的對話式了解、海量資訊的知識問答、基于思維鍊的邏輯推理、數學能力、代碼了解與生成能力幾個方面實作技術突破。據悉,科大訊飛在6月9日還将進一步實作星火 APP 等多個産品級應用釋出。
除上述以聊天機器人形式落地的産品外,還有聚焦工業端 AI 賦能的華為“盤古”大模型,專注跨模态視訊檢索能力的騰訊“混元”大模型等數十個大模型也在今年陸續釋出。
結語
盡管目前國内大模型産品如雨後春筍般湧現,但業界面臨的問題也較為突出。中國科學技術資訊研究所釋出的《中國人工智能大模型地圖研究報告》指出,自然語言處理仍是目前大模型研發最為活躍的重點領域,其次是多模态領域,在計算機視覺和智能語音等領域的大模型還較少。從研發主體分布看,大學、科研機構、企業等不同創新主體都在積極參與大模型研發,但學術界與産業界之間的聯合研發仍不足。
針對目前國内大模型發展情況,趙志耘建議,未來大陸還需加強資源和研發力量統籌,鼓勵大模型開源開放,強化國際合作,積極參與全球人工智能治理,加快人工智能治理原則和倫理規範在大模型研發全鍊條落地生根,以進一步促進大模型有序發展。
歡迎關注「新數潮」公衆号,和我們一起了解數字經濟!
一周資訊 | 中央政治局會議指出要重視通用人工智能發展
ChatGPT 掀起 AI 大模型風潮