數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革？

【文/觀察者網陳思佳】近年來，ChatGPT掀起了一股人工智能（AI）浪潮，生成式人工智能和人工智能生成内容（AIGC）的概念迅速進入社會各界的視野。在AI技術高速發展的當下，AIGC似乎已在不知不覺間滲透進人們的日常生活的方方面面。

7月6日至8日，以“智聯世界生成未來”為主題的第六屆世界人工智能大會（WAIC）在上海舉行，展覽涵蓋核心技術、智能終端、應用賦能、前沿技術四大闆塊，包括大模型、晶片、機器人、智能駕駛等領域，參展企業超400家，優秀初創企業超50家，首發首展新品達30餘款。

大模型和AIGC無疑是本次大會的焦點，華為、阿裡、百度、科大訊飛等多家廠商的30餘款大模型亮相世博展覽館，涵蓋圖檔生成、視訊生成、數字人等諸多AIGC項目的展台更是吸引大批觀衆。

但AI技術的迅猛發展也促使人們開始思考，大模型和AIGC具有什麼樣的前景？它們會給日常生活帶來怎樣的變革？生成式AI技術又有什麼樣的潛在發展門檻和風險？對此，在7月7日舉行的“聚焦·大模型時代AIGC新浪潮論壇”上，來自多家機構、企業和高校的專家分享了他們的看法。

2023世界人工智能大會

30餘款大模型同台競技

本屆WAIC聚焦大模型和AIGC，華為雲盤古大模型、科大訊飛星火認知大模型、商湯商量中文語言大模型、阿裡雲通義千問、百度文心一言等30餘款大模型亮相現場，各大廠商推出的産品涵蓋算力底座、模型即服務（MaaS）、通用大模型、垂直應用大模型等方方面面。

作為本次大會的“鎮館之寶”之一，華為帶來的昇騰AI“大模型超級工廠”覆寫大模型的資料&模型準備、算力準備&模型訓練、模型部署上線&內建等階段全流程。

目前基于昇騰AI原生孵化了業界首個兩千億參數的中文NLP大模型鵬城.盤古、業界首個多模态大模型紫東.太初以及華為雲盤古系列在内的20多個國産大模型。同時，昇騰AI也已适配支援了ChatGLM、LLaMA、GPT-3、BLOOM等數十個業界主流開源開放的大模型。

7月7日，華為雲CEO張平安還在華為開發者大會2023上宣布，盤古大模型3.0正式釋出。據他介紹，該模型是一個完全面向行業的大模型系列，“盤古大模型不作詩，也沒有時間作詩，因為它要深入到各行各業中去，讓AI賦予各行各業價值。”

商湯科技“日日新SenseNova”大模型體系則覆寫文本生成、圖像生成、數字人等多個領域。其中“商量SenseChat”是該體系下的千億級參數語言大模型，具備領先的語義了解、多輪對話、知識掌握、邏輯推理的綜合能力。目前，“商量SenseChat 2.0”已在醫療、金融、移動終端、代碼開發等領域為客戶提供服務。

作為“模型即服務”的倡導者，阿裡雲展出的通義大模型允許企業微調、訓練模型，打造模型開放平台，提供一站式模型服務。阿裡雲還展示了其雲計算技術體系的三層架構，從下到上分别包括基礎設施即服務（IaaS）、平台即服務（PaaS）和模型即服務（MaaS）。

此外，多款應用于垂直領域的大模型也亮相本屆WAIC。例如，達觀資料釋出的“曹植”大模型主要面向金融、政務等行業，具備長文本、垂直化和多語言等特點。蜜度釋出的“蜜度文修”大模型則專為校對這一垂直領域打造，在中文拼寫勘誤、文法糾正等方面的表現優于通用大模型ChatGPT。

圖檔生成、音樂創作、數字人……AIGC觸及生活方方面面

在迅猛發展的大模型的支援下，AIGC技術成為本屆WAIC的一大亮點，圖像生成、數字人直播、文本生成PPT、自動剪輯等多種生成式AI應用與大模型同步推出，相關展台可謂人山人海。

商湯科技展台展示了“秒畫SenseMirage”生成的圖像，這是一個包含商湯自研AIGC大模型和便捷的LoRA訓練能力，并提供第三方社群開源模型加速推理的創作平台。據介紹，秒畫SenseMirage 3.0的自研生成大模型參數提升至70億量級，具有更強的中文了解能力、更多樣化的風格選擇。

燧原科技也展示了文生圖MaaS平台服務産品“燧原曜圖”，基于燧原科技“邃思”系列晶片的算力支援，為使用者提供面向AIGC時代的高效易用、安全可靠的文生圖服務。通過軟硬體一體方案，該産品可以降低大規模AIGC應用的工程難度和算力成本。

網易伏羲推出了自研圖檔生成模型“丹青”和創意輔助産品“丹青約”，推動将AI技術應用于企業美術資産的生産創作流程中，将上線有靈美術平台。據介紹，“丹青”是基于原生中文語料資料及網易自有高品質圖檔資料訓練，為100%的國産大模型。

金山辦公的具備大語言模型能力的人工智能應用WPS AI則已經接入金山辦公旗下WPS文字、示範、表格、PDF、智能文檔和智能表格等元件。金山辦公表示，這是國内協同辦公賽道的首個類ChatGPT式應用，未來錨定AIGC、人機互動、知識再利用三個戰略方向發展。

在音樂創作方面，騰訊多媒體實驗室基于AIGC技術推出XMusic生成式通用作曲架構，支援視訊、圖檔、文字、标簽、哼唱等多模态内容作為輸入提示詞，生成情緒、曲風、節奏可控的音樂。在視訊配樂、互動娛樂、輔助創作、音樂教育等衆多領域都具有廣闊的應用前景。

騰訊還展出了将生成式AI應用于電子遊戲、科研、實時翻譯等領域的探索。例如，騰訊優圖展示的AI探星計劃，利用AI技術和騰訊雲的算力助力“中國天眼”（FAST），已在較短時間内快速發現數十顆脈沖星。

在智能手機的時代，AI技術也在與移動終端結合。美國高通公司展出了終端側生成式AI用例示範，在搭載第二代骁龍8移動平台的安卓手機運作超10億參數的Stable Diffusion模型，實作15秒内20步推理。

“大模型的産生并非一蹴而就”

AI熱潮席卷全球，也促使人們開始思考，生成式AI技術會給社會生産帶來怎樣的變化？AIGC又具備怎樣的發展前景？對此，7月7日上午舉行的“聚焦·大模型時代AIGC新浪潮論壇”上，來自多家機構、企業和高校的專家分享了他們的觀點。

京東探索研究院院長、京東科技智能服務與産品部總裁何曉東表示，生成式AI在今年取得了巨大的進展，可以做到文本生成、代碼生成、圖檔生成、視訊生成等，産生了生産力的變革。他認為，大模型帶來了AI流行的機遇，從傳統的基于某一個場景、某一個應用定制AI模型，進入到一個大的通用的模型可以服務于多個場景。

“一方面模型本身的成本是提高了，因為我們都知道，大模型本身需要大量的算力，需要大量的資料，需要一個很大、很強的綜合性團隊。在另一方面它的部署成本其實極大地降低了，因為一個模型可以部署到更多的地方。”何曉東說，“這就像我們進入工業時代，雖然工具更昂貴了，但它生産産品的效率反而提升了。”

何曉東表示，希望AIGC能加入更有創作力的領域，比如圖像繪畫生成等，“京東通過打造一站式的人工智能應用平台言犀平台，內建大量AI從感覺到認知到生成的技術，使得我們可以在各個層次組合出各種各樣豐富的應用式産品，服務各行各業。各行各業都能從這一次的人工智能技術進展中得到真正的提升。”

京東探索研究院院長、京東科技智能服務與産品部總裁何曉東發表講話

HiDream.ai創始人、加拿大工程院外籍院士梅濤認為，多模态AIGC主要面臨三大挑戰：第一是标記化（Tokenization），有沒有一種比較好的集合，能夠把文本、視覺、語音等資訊包含在一起。第二是解碼（Decoder），大語言模型中常用的Transformer架構并沒有在圖像、視訊中得到很好的應用。第三是對齊（Alignment），我們能不能做到不同模态之間交叉相關性的對齊。

梅濤指出，目前主流的視覺模型的能力邊界基本都在幾十億參數的區間，在圖像生成方面，人臉細節、手指細節、物體細節等問題都還沒有解決，還有很多工作要做。

“我們想做的一件事就是問問自己，到底我們有沒有可能把現在視覺多模态的基礎模型，從它現在能力對标GPT-2.0的時代，走向GPT-3.0的時代。當然這也是我們HiDream的一個初心。”梅濤說。

HiDream.ai創始人、加拿大工程院外籍院士梅濤發表講話

九章雲極聯合創始人尚明棟則談及人工智能基礎設施的變革。他表示，大模型的産生并非一蹴而就，而是需要完整的基礎設施更新，無法依靠單獨一個大模型解決更多的問題。他指出，基礎設施的構成包括算力、資料和軟體等方面。

尚明棟提到，美國初創公司CoreWeave在最近使用3584張H100晶片，僅用時11分鐘就完成GPT-3模型的訓練，整體開銷約2萬美元。但在2020年訓練GPT-3模型需要450萬美元，在2022年依然需要45萬美元。“我們看到，随着算力和并行的一些基礎軟體的演進，我們算力的成本在持續下降。而算力成本下降的速度，我們判斷也會快于模型大小增長。是以，以後算力将不會構成大模型計算的一個鴻溝。”

他指出，訓練更高品質、更高效的模型，就需要品質更好的資料，“我們也知道，受限于資料的邊界，考慮到資料隐私、資料安全等多方面因素，我們很難讓它直接在通用的資料中流通。是以我們需要建構垂直領域大模型，結合從算力、資料到基礎軟體去賦能于千行百業。”

九章雲極聯合創始人尚明棟發表講話

在基礎軟體方面，尚明棟認為，基礎軟體的核心價值在兩點，一是高效地排程、管理資料和算力，将原先複雜的大模型建構變得更加容易。二是通過對基礎軟體高效的工程化、子產品化和自動化，提高訓練的效率。基礎軟體效率的提升意味着算力的節省和成本的降低。

“是以，大模型未來的挑戰在于，我們希望大模型能夠落地各行各業，那麼落地于千行百業就需要和各個行業的業務結合在一起，并結合行業的業務知識。”尚明棟說。

“AI存在風險，但我們不應該因噎廢食”

然而，AIGC的發展也面臨諸多争議，從發展的門檻和壁壘到AI的風險和安全性都受到頗多質疑。對此，在“聚焦·大模型時代AIGC新浪潮論壇”的圓桌讨論環節中，多位專家指出，生成式AI發展可能面臨諸多挑戰和風險，但我們不能“因噎廢食”，需要在長期的發展中尋找應對的方案。

上海人工智能實驗室主任助理喬宇認為，大模型還存在很多問題，例如人們常說的“幻覺”、價值對齊、效率等，但社會各界需要用發展的目光看待AI，安全和發展是“一體兩翼”的關系，特别是中國的大模型還處于追趕階段，需要從發展的角度去看待安全問題。

談及大模型可能存在的價值觀方面的問題，喬宇表示，大模型的價值觀是由訓練資料得來的，“我們是不是能從訓練資料端去解決？有些模型用在專業領域的時候，圍繞這個專業領域，我們對它有一些安全要求，有可能從中繼承一些。是以要從大模型技術研發的不同環節來思考安全問題。”

喬宇強調，大模型的安全不單單是某一個科研團體、某一個産業領域或是中國單獨面臨的問題，它是全世界乃至全人類面臨的問題，“是以我認為在安全領域，我們應該展開更多的國際交流和合作，來共同面對和解決。”

“聚焦·大模型時代AIGC新浪潮論壇”圓桌讨論環節

香港中文大學助理教授王曆偉從人才和研究的角度切入，他認為，從人才培養的速度來看，很大的優秀科研人員基礎可以降低未來研發的門檻，訓練大模型的算力需求成本看起來也比較樂觀。“我覺得從短期或中長期來看，無論是人才儲備還是算力，大模型的研發門檻可能在慢慢降低。”

王曆偉表示，科研人員需要關注如何了解和評價大模型的能力，“如果我們持續從一種評價方式去衡量大模型的能力，可能多多少少還是比較片面。”他認為，學術領域人士很适合去更多地探索安全性和AI治理等方向的内容。

螞蟻集團機器智能部副總經理、螞蟻安全天筭實驗室主任張天翼表示，大模型帶來的風險問題不一定是新的問題，但更加深度的應用可能造成更全面的影響，包括生成内容安全問題、技術安全、隐私問題、合規問題以及倫理問題等。

張天翼認為，目前大模型存在三方面的風險，一是技術相關問題，模型本身可能被攻擊、被突破、被劫持。二是産業類風險，AI是否會帶來壟斷、勞動替代等問題。三是内容類的問題，是否會向使用者提供不安全的内容。

他表示，大模型的風險問題沒有“靈丹妙藥”，必然是一個長期對抗和博弈發展的過程，“比如說現在安全行業内的一個很直接的應用，我們也會用大模型來對抗更多大模型中的風險，這也會是一個‘用魔法打敗魔法’的方向。”

雲天勵飛副總裁、AI技術平台總經理肖嵘則為生成式AI的發展總結了四個問題，分别是生成内容存在“幻覺”的問題、工具使用和外部知識整合能力、邏輯推理能力和不具備持續學習能力的問題。

在安全問題上，肖嵘認為，大模型其實具備“價值觀”，它所認定的知識不一定就是事實，“解決這個問題其實有兩個路徑，第一個是它為什麼會産生有錯的東西？可能它學的東西都是不對的……是以我們需要對語料有體系地治理，保證其安全、可控。第二個也是我們正在大力推動的，比如對模型輸出的治理。”

但他也強調，AI是一種工具。“越強大的工具被用來作惡，可能影響也越大。”肖嵘說，“我認為，工具用得好不好，更多是人的問題。我們不應該因噎廢食，不是看到強大的工具就不去使用，而是更多地想想怎麼把它有序化。”

本文系觀察者網獨家稿件，未經授權，不得轉載。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革？

繼續閱讀

人工智能2024年一季度投融市場報告

關愛通丨從AIGC到矽基人同僚：人工智能疊代重塑HR管理政策

好家夥，iPhone16還沒釋出，售價就曝光了，據說全系256GB起步但價格和上一代128GB一樣！如果真是這樣那不得賣

沒想到騰訊在AI方面這麼有實力[震驚]，據IPRdaily中文網最新釋出的中國人工智能發明專利企業排行榜（TOP50）顯

中關村論壇筆記①｜10年後，人工智能将如何改變世界？

浦軟創業營第十期人工智能專場開營暨愛酷空間煥新更新儀式舉辦

真不得了，今年iPhone16系列要“殺瘋”！爆料說有30項更新變化，還說有蘋果自研端側大模型的iOS18，再加上蘋果取

中醫人工智能儀器的出現，預示着中醫采用西醫手段診斷成為可能。

華為是徹底好起來了，在Canalys公布的2024年Q1季度國内智能手機出貨量報告中，華為以1170萬台的出貨量排到了第

換手機的理由+1！說真的，雖然現在很多新手機的性能提升感覺并不強，但在功能體驗還是非常有吸引力的。就比如今年大火的AI手

2024中關村論壇年會|第七屆中關村國際前沿科技大賽落幕：海内外3100餘個項目參賽人工智能展現最強創新活力

首個人工智能選美大賽“Miss AI”，不隻看美貌

面向未來的前沿人工智能監管

牛來了？外資集體做多A股，量子技術和人工智能成大風口丨蔣衍看盤

24fall格拉斯哥大學招收全獎博士生人工智能/資料驅動/機器人方向

張瑾：人工智能與商業變革