天天看點

打通AI任督二脈,國産自研通用大模型“砭石”實力邁向AGI

作者:新智元

編輯:編輯部

【新智元導讀】全球領先AI公司智慧眼釋出了自研的通用大模型——砭石,海量代碼文本資料訓練後展現出強大的湧現能力,不僅能實作代碼生成,韻律創作,甚至是多模态AI了解效果驚人。

每一次關鍵技術取得通用化的突破,都會深刻改變生産方式,并顯著提升生産力水準,而「大模型」成為了打通人工智能技術通用性「任督二脈」的關鍵。智慧眼,作為全球領先的人工智能企業,最近推出了其創新研發的通用大模型——砭石。

AI正在從感覺智能、認知智能向決策智能快速疊代演進。

在1.0時代,感覺智能中以計算機視覺為代表,即基于深度學習算法,賦能計算機了解數字圖像和視訊,智慧眼正是在這個時候建構了機器視覺大模型,并在IDC的中國人工智能之計算機視覺應用市場佔有率排名中進入前七,榮獲中國智能科學技術最高獎——吳文俊人工智能科技進步獎。

2.0階段,認知智能将從認知心理學、腦科學及人類社會曆史中汲取靈感,并結合跨領域知識圖譜、自然語言處理、因果推理等技術,建立穩定擷取和表達知識的有效機制,智慧眼釋出了人工智能中台和大資料中台産品,實作了從感覺智能到認知智能的跨越。

到了3.0時代,AI+X成為前沿方向,需要采用海量的高品質通用資料訓練一個基礎的底座,再針對不同的場景,利用少量的專業資料進行微調,實作低成本的AI場景落地。

智慧眼研發了通用大模型砭石,該模型基于嚴格稽核過濾的海量多模态資料訓練,通過「預訓練+精調」模式帶來了新的标準化AI研發範式,實作AI模型在更統一、簡單的方式下規模化生産,支援多種任務執行。

打通AI任督二脈,國産自研通用大模型“砭石”實力邁向AGI

大模型生成代碼,砭石通過對開源代碼資料集進行多次清洗,得到高品質的代碼資料集,随後通過預訓練和CoT訓練等方式,使得大模型具有強大的代碼生成和推理能力,極大地提高了軟體開發的效率和品質。

打通AI任督二脈,國産自研通用大模型“砭石”實力邁向AGI

大模型寫作能力,砭石大模型在更多參數和更複雜的結構基礎上,使用海量的通用文本型資料進行預訓練,學習了大量通用知識和邏輯,表現出了強大湧現能力和學習能力,生成了富有韻律、節奏和情感表達的詩歌。

砭石大模型基于自然對話方式了解和執行任務,提供多種能力包含文本、圖像、視訊、音頻輸入,生成式輸出文本資訊,具備閑聊和知識問答能力,可以為情感陪伴、政策問答、大資料分析等場景賦能。

三大核心技術賦能,新一代大模型順勢而出

大模型的創新,遠不止于模型本身的革新,其更深層次地依賴于人工智能領域中的各項核心技術突破。

在這方面,智慧眼公司擁有顯著的優勢,其在知識圖譜、智能大模型以及隐私計算等關鍵技術上,都擁有自主研發的核心算法和獨立的知識産權,這為通用大模型創新提供了堅實的基礎。包括:

  • 在知識圖譜方面:公司突破保護隐私的分布式知識遷移和聯邦圖譜推理,接入差異化的大規模行業資料,建構世界一流的高可信高品質的海量資料知識圖譜,為知識圖譜緩解大模型幻覺奠定基礎。
  • 在智能大模型方面:公司突破了隐私計算條件下的大模型聯邦訓練、基于知識圖譜的大模型知識增強等核心技術,顯著提升大模型在專業領域的資訊生成準确度。
  • 在隐私計算方面:突破了保護隐私的分布式知識遷移和聯邦圖譜推理技術,實作對高價值使用者的敏感隐私資料的脫敏,真正做到資料的「可用不可見」安全應用,實作分布式知識的融合和基于分布式資料的大模型訓練,支撐了使用者資料價值的釋放。

四大基礎模型融合,共同塑造超強通用能力

智慧眼砭石大模型的核心定位是為各行各業注入新的活力,采用完全的分層解耦設計,包括兩層:

  • 第一層為砭石通用大模型層,主要包括機器視覺、自然語言了解、多模态和認知4大基礎模型,為各種應用場景提供相關的AI基礎能力;
  • 第二層為行業大模型,基于通用大模型層,能夠整合行業使用者的自有資料,訓練客戶的自有專有大模型。

通過這種分層次的設計,智慧眼砭石大模型不僅提供了廣泛的通用能力,還能根據各行業的具體情況,實作高度個性化的賦能。

具體來說,基礎模型層面包含:

  • 機器視覺大模型,「為機器植入眼睛與大腦」。此模型通過在大規模圖像資料上進行訓練,可以實作各種視覺任務,能夠進行圖像的分割和識别、分析視訊等。
  • 自然語言了解大模型,「讓機器了解人類語言」。此模型基于數T Token的高品質語料訓練而成,能夠實作負責的自然語言處理任務。
  • 多模态大模型,「讓機器擁有豐富感官」。此模型通過對文本、圖檔、視訊和音頻等不同儲存資訊載體的認知和了解,來模拟人與人之間的互動方式,為創新性應用提供了堅實的基礎。
  • 認知大模型,「讓機器思考分析決策」。此模型能夠适應包括各類傳感器等不同類型感覺資料源的輸入,實作對環境的的了解與分析。

在行業大模型層面,砭石将涵蓋諸如醫療、醫保、金融、保險、政務、養老、教育多個專業領域,這些大模型的核心價值在于為不同行業的發展提供了強大的賦能。

總結來說,基礎大模型緻力于攻克技術難題,深入探索通用性與泛化性;而行業大模型則通過深度融合行業資料與知識特性,為特定行業量身打造堅實的基礎。

基礎大模型為行業大模型的建設提供有力支撐,同時,行業大模型又能夠結合實際應用場景與真實資料,為基礎大模型的進一步優化提供寶貴的回報與滋養。

大模型堪稱人工智能領域的一座重要裡程碑。

展望未來,智慧眼将秉承持續創新的精神,引領AI技術發展浪潮,推動大模型技術如高山流水般洶湧澎湃,廣泛覆寫醫療、醫保、金融、保險、政務、養老、教育等各行各業,進而為社會發展注入全新的、高品質的生産力。

繼續閱讀