30多款大模型同台競技！在WAIC2023看盡國内AI主流大模型

探營2023世界人工智能大會，什麼值得看

作者／ IT時報記者沈毅斌

編輯／王昕孫妍

2022年的世界人工智能大會，帶領觀衆走進虛拟與現實相結合的世界——元宇宙。今年，ChatGPT火熱得發燙，國内的百度、華為等産業巨頭紛紛秀出文心一言、盤古等自研方案——大模型順理成章成為2023年世界人工智能大會的“主角”。

7月5日，2023WAIC世界人工智能大會九大“鎮館之寶”揭曉，其中與大模型相關的就占據了“半壁江山”，此外還有30餘款來自不同企業的大模型産品和技術悉數亮相，展示着大模型在千行百業的多元化應用。

商湯大模型能“說”善“畫”

“假設你是一名記者，請寫一篇關于本屆人工智能大會的報道。”

“今天有幸來參加在上海舉辦的2023世界人工智能大會，這場盛會彙集了來自全球各地的科學家、企業家、政策制定者，共同探讨AI技術如何改變人們的未來……”這是《IT時報》記者探營時，與商湯自研的中文語言大模型——SenseChat之間的一段對話。

商湯現場從業人員介紹，本屆WAIC上商湯展出的SenseChat商量2.0最新版本，是基于“商湯日日新SenseNova”大模型體系下開發的千億級參數語言大模型。在知識準确性、上下文了解能力、邏輯判斷能力、創作能力等方面都有大幅度提升，甚至在一些細分名額上已經超過GPT3.5，是目前表現最好的中國語言大模型之一。其同時支援簡體中文、繁體中文、英文等多種語言互動，滿足不同人群、不同場景的對話需求。

訓練方面，商湯一方面利用大量企業垂直領域的資料進行訓練，增加SenseChat商量知識的深度和廣度；另一方面還上線了外接資料庫的功能，使用時隻需要将SenseChat商量與企業自己的資料庫進行連接配接，便能自動檢索和學習資料庫裡的知識，進而保證問答資料的準确性。

不僅如此，商湯展台内還展示了一幅攤開的巨型卷軸，畫着一隻穿着潮流、戴着墨鏡的酷炫小熊，這是本屆WAIC商湯帶來的另一款大模型——AI繪畫大模型秒畫SenseMirage。

現場從業人員介紹，秒畫SenseMirage 3.0的自研生成大模型參數已經提升至70億量級，不僅能實作更清晰、更精緻的細節刻畫，生成速度也是秒級的。同時，在商湯的大語言模型的加持下，秒畫SenseMirage能夠更加準确地了解使用者表述，隻需輸入幾個簡單的關鍵詞彙，便能自動生成畫作。例如輸入潮流、卡通、熊、墨鏡等詞語，就能繪畫出上文描述的炫酷小熊。

文心一格讓人人都能“P圖”

說到AI繪畫大模型，不得不提的還有百度的文心一格。作為本屆WAIC的“鎮館之寶”之一，文心一格與文心一言遙相呼應，經曆了一年的疊代和更新，在品質與操作方面都有巨大進步。百度從業人員告訴《IT時報》記者，在畫面品質上，文心一格經過3D渲染等步驟已經可以生成接近實景的圖檔，無論是人物面部表情，還是毛發等小細節，都能清晰準确進行刻畫。

“P圖”曾經是一項頗具門檻的圖檔修改美化技術，如今百度文心一格上線的塗抹功能，利用人工智能AI編輯功能，擷取整幅畫作的編輯資訊後，對塗抹區域的内容進行與原畫風格一緻的補全編輯，并對補全畫作連接配接處進行平滑處理，最終生成使用者滿意的理想畫作，讓人人都可以輕松掌握“P圖”的技能。

值得一提的是，文心一格還推出首創性的圖檔風格疊加功能，使用時隻需要上傳兩張不同風格的圖檔，通過調整參數或者輸入文字要求，便能自動融合成一張圖檔，進而激發創作者靈感。

目前，文心一格注冊使用者超過600萬，廣告營銷、内容制作、遊戲原畫等多個場景都有應用，使用者通過微信小程式就能快速接入。

“式說”大模型重構企業級軟體

生成圖檔、生成文案、生成攻略，在激烈的大模型賽道，第四範式走出了一條與衆不同的道路，即将大模型技術聚焦企業軟體領域，用生成式AI重構企業軟體。是以，聚焦to B的多模态大模型産品“式說”應運而生。

第四範式現場從業人員向記者解釋，“式說”不僅擁有輸入輸出多模态、知識庫、Copilot（微軟AI助手）、思維鍊等核心技術，同時具備内容可信、成本可控、資料安全等企業級優勢。首先，“式說”保證企業能私有化部署大模型，所需算力成本相對可控；其次，“式說”生成的内容更加準确、可靠，并且在資訊輸出時定位原始出處，實作所有資訊都“有據可查”；最後，在使用過程中，“式說”能做到知錯能改，不斷學習來更好地服務企業。

例如，一家零售門店的管理涉及員工管理、貨品采購、庫存控制、銷售增長、處理客訴等多個環節，這些都需要在不同的系統上完成；而門店店長在管理時，就需要從各個系統中擷取資料并進行篩選，甚至一些重要資料還需要找到專門資料團隊才能擷取，費時費力。

若是使用“式說”大模型後，零售門店店長可以直接通過對話形式，比如提問“檢視商品銷量、值班人員狀态、違規操作”等關鍵語句，“式說”就能從不同系統中調用相關資訊，讓日常散落在多個系統的管理工作在一個對話框上直接完成，管理将是以變得更加便捷。

在司法領域，司法人員不僅要掌握相關領域的法律法規、司法解釋，還要将法律知識靈活運用在法律分析、法律檢索、法律寫作、法律論證等具體實踐上。基于“式說”生成式AI打造的司法小助手，能在繁多的法律檔案中快速定位并檢索資料，還可以進行相應的法律文書書寫、校對工作。此外，針對常見案件、速裁案件，可以協助提取審判的關鍵要素等，讓司法人員的工作更高效。

據悉，自“式說”釋出以來，已經在金融、零售、醫療、物流、營運商、房地産等多個領域的上百家企業落地，積累了數十類國内最早的AIGC産業應用，成為行業中不同崗位的得力助手。

華為昇騰AI孵化原生大模型

去年WAIC，華為昇騰AI帶着全球首個三模态模型“紫東太初”亮相，成為“鎮館之寶”之一。今年，華為昇騰AI再次憑借“大模型超級工廠”奪得“鎮館之寶”一席之位。與去年不同的是，“大模型超級工廠”并不是單一的大模型，而是在資料＆模型準備、算力準備＆模型訓練、模型部署上線＆內建等階段全流程使能大模型的開發與應用創新。

華為現場從業人員告訴《IT時報》記者，昇騰已原生孵化和适配30多個大模型，成為 AI 大模型創新首選，其中，國内原生大模型有一半基于昇騰AI孵化。

為了能更好地展現昇騰AI在大模型開發與應用創新的作用，華為展台分别從軟體和硬體兩方面進行展示。硬體方面，大模型對算力需求的增長速度遠遠高于硬體算力的增長速度，是以，建立大模型就需要有一個AI叢集，才可以滿足大模型的訓練需求。但AI叢集建設又面臨着算力規模、液冷、跨域協同和可靠性4大關鍵技術挑戰，Atlas 900 PoD A2叢集基礎單元應運而生。

這台“大家夥”擁有黑色的金屬外殼，長方形的體型，看起來平平無奇，實際卻暗藏玄機。現場從業人員介紹，Atlas 900 PoD A2在算力規模上支援萬卡叢集，這就意味着即便是GPT-4級别的算力需求也能很好适配；其次，Atlas 900 PoD A2采用液冷、互聯、供電三總線設計，傳遞周期由兩周縮短為3天。資料顯示，Atlas 900 PoD A2的PUE（資料中心能源效率名額）值低于1.15，在綠色減排上表現出色。

軟體同樣也是訓練大模型的關鍵環節，“大模型超級工廠”設立了可診斷、可衡量、可恢複的多級可靠機制，若是其中某一節點發生故障，系統會第一時間記錄下來，同時将故障節點隔離，并調動其他節點資源繼續訓練，以此來保證訓練的穩定性。

“相比業界其他叢集，我們能實作10倍級提升叢集系統的穩定性。”華為現場從業人員說。

排版／季嘉穎

圖檔／ IT時報

來源／《IT時報》公衆号vittimes

E N D

請加「星标」不錯過我們】】】