天天看點

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

探營2023世界人工智能大會,什麼值得看

作者/ IT時報記者 沈毅斌

編輯/ 王昕 孫妍

2022年的世界人工智能大會,帶領觀衆走進虛拟與現實相結合的世界——元宇宙。今年,ChatGPT火熱得發燙,國内的百度、華為等産業巨頭紛紛秀出文心一言、盤古等自研方案——大模型順理成章成為2023年世界人工智能大會的“主角”。

7月5日,2023WAIC世界人工智能大會九大“鎮館之寶”揭曉,其中與大模型相關的就占據了“半壁江山”,此外還有30餘款來自不同企業的大模型産品和技術悉數亮相,展示着大模型在千行百業的多元化應用。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

商湯大模型能“說”善“畫”

“假設你是一名記者,請寫一篇關于本屆人工智能大會的報道。”

“今天有幸來參加在上海舉辦的2023世界人工智能大會,這場盛會彙集了來自全球各地的科學家、企業家、政策制定者,共同探讨AI技術如何改變人們的未來……”這是《IT時報》記者探營時,與商湯自研的中文語言大模型——SenseChat之間的一段對話。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

商湯現場從業人員介紹,本屆WAIC上商湯展出的SenseChat商量2.0最新版本,是基于“商湯日日新SenseNova”大模型體系下開發的千億級參數語言大模型。在知識準确性、上下文了解能力、邏輯判斷能力、創作能力等方面都有大幅度提升,甚至在一些細分名額上已經超過GPT3.5,是目前表現最好的中國語言大模型之一。其同時支援簡體中文、繁體中文、英文等多種語言互動,滿足不同人群、不同場景的對話需求。

訓練方面,商湯一方面利用大量企業垂直領域的資料進行訓練,增加SenseChat商量知識的深度和廣度;另一方面還上線了外接資料庫的功能,使用時隻需要将SenseChat商量與企業自己的資料庫進行連接配接,便能自動檢索和學習資料庫裡的知識,進而保證問答資料的準确性。

不僅如此,商湯展台内還展示了一幅攤開的巨型卷軸,畫着一隻穿着潮流、戴着墨鏡的酷炫小熊,這是本屆WAIC商湯帶來的另一款大模型——AI繪畫大模型秒畫SenseMirage。

現場從業人員介紹,秒畫SenseMirage 3.0的自研生成大模型參數已經提升至70億量級,不僅能實作更清晰、更精緻的細節刻畫,生成速度也是秒級的。同時,在商湯的大語言模型的加持下,秒畫SenseMirage能夠更加準确地了解使用者表述,隻需輸入幾個簡單的關鍵詞彙,便能自動生成畫作。例如輸入潮流、卡通、熊、墨鏡等詞語,就能繪畫出上文描述的炫酷小熊。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

文心一格讓人人都能“P圖”

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

說到AI繪畫大模型,不得不提的還有百度的文心一格。作為本屆WAIC的“鎮館之寶”之一,文心一格與文心一言遙相呼應,經曆了一年的疊代和更新,在品質與操作方面都有巨大進步。百度從業人員告訴《IT時報》記者,在畫面品質上,文心一格經過3D渲染等步驟已經可以生成接近實景的圖檔,無論是人物面部表情,還是毛發等小細節,都能清晰準确進行刻畫。

“P圖”曾經是一項頗具門檻的圖檔修改美化技術,如今百度文心一格上線的塗抹功能,利用人工智能AI編輯功能,擷取整幅畫作的編輯資訊後,對塗抹區域的内容進行與原畫風格一緻的補全編輯,并對補全畫作連接配接處進行平滑處理,最終生成使用者滿意的理想畫作,讓人人都可以輕松掌握“P圖”的技能。

值得一提的是,文心一格還推出首創性的圖檔風格疊加功能,使用時隻需要上傳兩張不同風格的圖檔,通過調整參數或者輸入文字要求,便能自動融合成一張圖檔,進而激發創作者靈感。

目前,文心一格注冊使用者超過600萬,廣告營銷、内容制作、遊戲原畫等多個場景都有應用,使用者通過微信小程式就能快速接入。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型
30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

“式說”大模型重構企業級軟體

生成圖檔、生成文案、生成攻略,在激烈的大模型賽道,第四範式走出了一條與衆不同的道路,即将大模型技術聚焦企業軟體領域,用生成式AI重構企業軟體。是以,聚焦to B的多模态大模型産品“式說”應運而生。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

第四範式現場從業人員向記者解釋,“式說”不僅擁有輸入輸出多模态、知識庫、Copilot(微軟AI助手)、思維鍊等核心技術,同時具備内容可信、成本可控、資料安全等企業級優勢。首先,“式說”保證企業能私有化部署大模型,所需算力成本相對可控;其次,“式說”生成的内容更加準确、可靠,并且在資訊輸出時定位原始出處,實作所有資訊都“有據可查”;最後,在使用過程中,“式說”能做到知錯能改,不斷學習來更好地服務企業。

例如,一家零售門店的管理涉及員工管理、貨品采購、庫存控制、銷售增長、處理客訴等多個環節,這些都需要在不同的系統上完成;而門店店長在管理時,就需要從各個系統中擷取資料并進行篩選,甚至一些重要資料還需要找到專門資料團隊才能擷取,費時費力。

若是使用“式說”大模型後,零售門店店長可以直接通過對話形式,比如提問“檢視商品銷量、值班人員狀态、違規操作”等關鍵語句,“式說”就能從不同系統中調用相關資訊,讓日常散落在多個系統的管理工作在一個對話框上直接完成,管理将是以變得更加便捷。

在司法領域,司法人員不僅要掌握相關領域的法律法規、司法解釋,還要将法律知識靈活運用在法律分析、法律檢索、法律寫作、法律論證等具體實踐上。基于“式說”生成式AI打造的司法小助手,能在繁多的法律檔案中快速定位并檢索資料,還可以進行相應的法律文書書寫、校對工作。此外,針對常見案件、速裁案件,可以協助提取審判的關鍵要素等,讓司法人員的工作更高效。

據悉,自“式說”釋出以來,已經在金融、零售、醫療、物流、營運商、房地産等多個領域的上百家企業落地,積累了數十類國内最早的AIGC産業應用,成為行業中不同崗位的得力助手。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

華為昇騰AI孵化原生大模型

去年WAIC,華為昇騰AI帶着全球首個三模态模型“紫東太初”亮相,成為“鎮館之寶”之一。今年,華為昇騰AI再次憑借“大模型超級工廠”奪得“鎮館之寶”一席之位。與去年不同的是,“大模型超級工廠”并不是單一的大模型,而是在資料&模型準備、算力準備&模型訓練、模型部署上線&內建等階段全流程使能大模型的開發與應用創新。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

華為現場從業人員告訴《IT時報》記者,昇騰已原生孵化和适配30多個大模型,成為 AI 大模型創新首選,其中,國内原生大模型有一半基于昇騰AI孵化。

為了能更好地展現昇騰AI在大模型開發與應用創新的作用,華為展台分别從軟體和硬體兩方面進行展示。硬體方面,大模型對算力需求的增長速度遠遠高于硬體算力的增長速度,是以,建立大模型就需要有一個AI叢集,才可以滿足大模型的訓練需求。但AI叢集建設又面臨着算力規模、液冷、跨域協同和可靠性4大關鍵技術挑戰,Atlas 900 PoD A2叢集基礎單元應運而生。

這台“大家夥”擁有黑色的金屬外殼,長方形的體型,看起來平平無奇,實際卻暗藏玄機。現場從業人員介紹,Atlas 900 PoD A2在算力規模上支援萬卡叢集,這就意味着即便是GPT-4級别的算力需求也能很好适配;其次,Atlas 900 PoD A2采用液冷、互聯、供電三總線設計,傳遞周期由兩周縮短為3天。資料顯示,Atlas 900 PoD A2的PUE(資料中心能源效率名額)值低于1.15,在綠色減排上表現出色。

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型

軟體同樣也是訓練大模型的關鍵環節,“大模型超級工廠”設立了可診斷、可衡量、可恢複的多級可靠機制,若是其中某一節點發生故障,系統會第一時間記錄下來,同時将故障節點隔離,并調動其他節點資源繼續訓練,以此來保證訓練的穩定性。

“相比業界其他叢集,我們能實作10倍級提升叢集系統的穩定性。”華為現場從業人員說。

排版/ 季嘉穎

圖檔/ IT時報

來源/《IT時報》公衆号vittimes

E N D

請加「星标」不錯過我們】】】

30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型
30多款大模型同台競技!在WAIC2023看盡國内AI主流大模型