天天看點

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

作者:觀察者網

【文/觀察者網 陳思佳】近年來,ChatGPT掀起了一股人工智能(AI)浪潮,生成式人工智能和人工智能生成内容(AIGC)的概念迅速進入社會各界的視野。在AI技術高速發展的當下,AIGC似乎已在不知不覺間滲透進人們的日常生活的方方面面。

7月6日至8日,以“智聯世界 生成未來”為主題的第六屆世界人工智能大會(WAIC)在上海舉行,展覽涵蓋核心技術、智能終端、應用賦能、前沿技術四大闆塊,包括大模型、晶片、機器人、智能駕駛等領域,參展企業超400家,優秀初創企業超50家,首發首展新品達30餘款。

大模型和AIGC無疑是本次大會的焦點,華為、阿裡、百度、科大訊飛等多家廠商的30餘款大模型亮相世博展覽館,涵蓋圖檔生成、視訊生成、數字人等諸多AIGC項目的展台更是吸引大批觀衆。

但AI技術的迅猛發展也促使人們開始思考,大模型和AIGC具有什麼樣的前景?它們會給日常生活帶來怎樣的變革?生成式AI技術又有什麼樣的潛在發展門檻和風險?對此,在7月7日舉行的“聚焦·大模型時代AIGC新浪潮論壇”上,來自多家機構、企業和高校的專家分享了他們的看法。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

2023世界人工智能大會

30餘款大模型同台競技

本屆WAIC聚焦大模型和AIGC,華為雲盤古大模型、科大訊飛星火認知大模型、商湯商量中文語言大模型、阿裡雲通義千問、百度文心一言等30餘款大模型亮相現場,各大廠商推出的産品涵蓋算力底座、模型即服務(MaaS)、通用大模型、垂直應用大模型等方方面面。

作為本次大會的“鎮館之寶”之一,華為帶來的昇騰AI“大模型超級工廠”覆寫大模型的資料&模型準備、算力準備&模型訓練、模型部署上線&內建等階段全流程。

目前基于昇騰AI原生孵化了業界首個兩千億參數的中文NLP大模型鵬城.盤古、業界首個多模态大模型紫東.太初以及華為雲盤古系列在内的20多個國産大模型。同時,昇騰AI也已适配支援了ChatGLM、LLaMA、GPT-3、BLOOM等數十個業界主流開源開放的大模型。

7月7日,華為雲CEO張平安還在華為開發者大會2023上宣布,盤古大模型3.0正式釋出。據他介紹,該模型是一個完全面向行業的大模型系列,“盤古大模型不作詩,也沒有時間作詩,因為它要深入到各行各業中去,讓AI賦予各行各業價值。”

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

商湯科技“日日新SenseNova”大模型體系則覆寫文本生成、圖像生成、數字人等多個領域。其中“商量SenseChat”是該體系下的千億級參數語言大模型,具備領先的語義了解、多輪對話、知識掌握、邏輯推理的綜合能力。目前,“商量SenseChat 2.0”已在醫療、金融、移動終端、代碼開發等領域為客戶提供服務。

作為“模型即服務”的倡導者,阿裡雲展出的通義大模型允許企業微調、訓練模型,打造模型開放平台,提供一站式模型服務。阿裡雲還展示了其雲計算技術體系的三層架構,從下到上分别包括基礎設施即服務(IaaS)、平台即服務(PaaS)和模型即服務(MaaS)。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

此外,多款應用于垂直領域的大模型也亮相本屆WAIC。例如,達觀資料釋出的“曹植”大模型主要面向金融、政務等行業,具備長文本、垂直化和多語言等特點。蜜度釋出的“蜜度文修”大模型則專為校對這一垂直領域打造,在中文拼寫勘誤、文法糾正等方面的表現優于通用大模型ChatGPT。

圖檔生成、音樂創作、數字人……AIGC觸及生活方方面面

在迅猛發展的大模型的支援下,AIGC技術成為本屆WAIC的一大亮點,圖像生成、數字人直播、文本生成PPT、自動剪輯等多種生成式AI應用與大模型同步推出,相關展台可謂人山人海。

商湯科技展台展示了“秒畫SenseMirage”生成的圖像,這是一個包含商湯自研AIGC大模型和便捷的LoRA訓練能力,并提供第三方社群開源模型加速推理的創作平台。據介紹,秒畫SenseMirage 3.0的自研生成大模型參數提升至70億量級,具有更強的中文了解能力、更多樣化的風格選擇。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

燧原科技也展示了文生圖MaaS平台服務産品“燧原曜圖”,基于燧原科技“邃思”系列晶片的算力支援,為使用者提供面向AIGC時代的高效易用、安全可靠的文生圖服務。通過軟硬體一體方案,該産品可以降低大規模AIGC應用的工程難度和算力成本。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

網易伏羲推出了自研圖檔生成模型“丹青”和創意輔助産品“丹青約”,推動将AI技術應用于企業美術資産的生産創作流程中,将上線有靈美術平台。據介紹,“丹青”是基于原生中文語料資料及網易自有高品質圖檔資料訓練,為100%的國産大模型。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

金山辦公的具備大語言模型能力的人工智能應用WPS AI則已經接入金山辦公旗下WPS文字、示範、表格、PDF、智能文檔和智能表格等元件。金山辦公表示,這是國内協同辦公賽道的首個類ChatGPT式應用,未來錨定AIGC、人機互動、知識再利用三個戰略方向發展。

在音樂創作方面,騰訊多媒體實驗室基于AIGC技術推出XMusic生成式通用作曲架構,支援視訊、圖檔、文字、标簽、哼唱等多模态内容作為輸入提示詞,生成情緒、曲風、節奏可控的音樂。在視訊配樂、互動娛樂、輔助創作、音樂教育等衆多領域都具有廣闊的應用前景。

騰訊還展出了将生成式AI應用于電子遊戲、科研、實時翻譯等領域的探索。例如,騰訊優圖展示的AI探星計劃,利用AI技術和騰訊雲的算力助力“中國天眼”(FAST),已在較短時間内快速發現數十顆脈沖星。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

在智能手機的時代,AI技術也在與移動終端結合。美國高通公司展出了終端側生成式AI用例示範,在搭載第二代骁龍8移動平台的安卓手機運作超10億參數的Stable Diffusion模型,實作15秒内20步推理。

“大模型的産生并非一蹴而就”

AI熱潮席卷全球,也促使人們開始思考,生成式AI技術會給社會生産帶來怎樣的變化?AIGC又具備怎樣的發展前景?對此,7月7日上午舉行的“聚焦·大模型時代AIGC新浪潮論壇”上,來自多家機構、企業和高校的專家分享了他們的觀點。

京東探索研究院院長、京東科技智能服務與産品部總裁何曉東表示,生成式AI在今年取得了巨大的進展,可以做到文本生成、代碼生成、圖檔生成、視訊生成等,産生了生産力的變革。他認為,大模型帶來了AI流行的機遇,從傳統的基于某一個場景、某一個應用定制AI模型,進入到一個大的通用的模型可以服務于多個場景。

“一方面模型本身的成本是提高了,因為我們都知道,大模型本身需要大量的算力,需要大量的資料,需要一個很大、很強的綜合性團隊。在另一方面它的部署成本其實極大地降低了,因為一個模型可以部署到更多的地方。”何曉東說,“這就像我們進入工業時代,雖然工具更昂貴了,但它生産産品的效率反而提升了。”

何曉東表示,希望AIGC能加入更有創作力的領域,比如圖像繪畫生成等,“京東通過打造一站式的人工智能應用平台言犀平台,內建大量AI從感覺到認知到生成的技術,使得我們可以在各個層次組合出各種各樣豐富的應用式産品,服務各行各業。各行各業都能從這一次的人工智能技術進展中得到真正的提升。”

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

京東探索研究院院長、京東科技智能服務與産品部總裁何曉東發表講話

HiDream.ai創始人、加拿大工程院外籍院士梅濤認為,多模态AIGC主要面臨三大挑戰:第一是标記化(Tokenization),有沒有一種比較好的集合,能夠把文本、視覺、語音等資訊包含在一起。第二是解碼(Decoder),大語言模型中常用的Transformer架構并沒有在圖像、視訊中得到很好的應用。第三是對齊(Alignment),我們能不能做到不同模态之間交叉相關性的對齊。

梅濤指出,目前主流的視覺模型的能力邊界基本都在幾十億參數的區間,在圖像生成方面,人臉細節、手指細節、物體細節等問題都還沒有解決,還有很多工作要做。

“我們想做的一件事就是問問自己,到底我們有沒有可能把現在視覺多模态的基礎模型,從它現在能力對标GPT-2.0的時代,走向GPT-3.0的時代。當然這也是我們HiDream的一個初心。”梅濤說。

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

HiDream.ai創始人、加拿大工程院外籍院士梅濤發表講話

九章雲極聯合創始人尚明棟則談及人工智能基礎設施的變革。他表示,大模型的産生并非一蹴而就,而是需要完整的基礎設施更新,無法依靠單獨一個大模型解決更多的問題。他指出,基礎設施的構成包括算力、資料和軟體等方面。

尚明棟提到,美國初創公司CoreWeave在最近使用3584張H100晶片,僅用時11分鐘就完成GPT-3模型的訓練,整體開銷約2萬美元。但在2020年訓練GPT-3模型需要450萬美元,在2022年依然需要45萬美元。“我們看到,随着算力和并行的一些基礎軟體的演進,我們算力的成本在持續下降。而算力成本下降的速度,我們判斷也會快于模型大小增長。是以,以後算力将不會構成大模型計算的一個鴻溝。”

他指出,訓練更高品質、更高效的模型,就需要品質更好的資料,“我們也知道,受限于資料的邊界,考慮到資料隐私、資料安全等多方面因素,我們很難讓它直接在通用的資料中流通。是以我們需要建構垂直領域大模型,結合從算力、資料到基礎軟體去賦能于千行百業。”

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

九章雲極聯合創始人尚明棟發表講話

在基礎軟體方面,尚明棟認為,基礎軟體的核心價值在兩點,一是高效地排程、管理資料和算力,将原先複雜的大模型建構變得更加容易。二是通過對基礎軟體高效的工程化、子產品化和自動化,提高訓練的效率。基礎軟體效率的提升意味着算力的節省和成本的降低。

“是以,大模型未來的挑戰在于,我們希望大模型能夠落地各行各業,那麼落地于千行百業就需要和各個行業的業務結合在一起,并結合行業的業務知識。”尚明棟說。

“AI存在風險,但我們不應該因噎廢食”

然而,AIGC的發展也面臨諸多争議,從發展的門檻和壁壘到AI的風險和安全性都受到頗多質疑。對此,在“聚焦·大模型時代AIGC新浪潮論壇”的圓桌讨論環節中,多位專家指出,生成式AI發展可能面臨諸多挑戰和風險,但我們不能“因噎廢食”,需要在長期的發展中尋找應對的方案。

上海人工智能實驗室主任助理喬宇認為,大模型還存在很多問題,例如人們常說的“幻覺”、價值對齊、效率等,但社會各界需要用發展的目光看待AI,安全和發展是“一體兩翼”的關系,特别是中國的大模型還處于追趕階段,需要從發展的角度去看待安全問題。

談及大模型可能存在的價值觀方面的問題,喬宇表示,大模型的價值觀是由訓練資料得來的,“我們是不是能從訓練資料端去解決?有些模型用在專業領域的時候,圍繞這個專業領域,我們對它有一些安全要求,有可能從中繼承一些。是以要從大模型技術研發的不同環節來思考安全問題。”

喬宇強調,大模型的安全不單單是某一個科研團體、某一個産業領域或是中國單獨面臨的問題,它是全世界乃至全人類面臨的問題,“是以我認為在安全領域,我們應該展開更多的國際交流和合作,來共同面對和解決。”

數字人、AI繪圖……人工智能生成内容會帶來怎樣的變革?

“聚焦·大模型時代AIGC新浪潮論壇”圓桌讨論環節

香港中文大學助理教授王曆偉從人才和研究的角度切入,他認為,從人才培養的速度來看,很大的優秀科研人員基礎可以降低未來研發的門檻,訓練大模型的算力需求成本看起來也比較樂觀。“我覺得從短期或中長期來看,無論是人才儲備還是算力,大模型的研發門檻可能在慢慢降低。”

王曆偉表示,科研人員需要關注如何了解和評價大模型的能力,“如果我們持續從一種評價方式去衡量大模型的能力,可能多多少少還是比較片面。”他認為,學術領域人士很适合去更多地探索安全性和AI治理等方向的内容。

螞蟻集團機器智能部副總經理、螞蟻安全天筭實驗室主任張天翼表示,大模型帶來的風險問題不一定是新的問題,但更加深度的應用可能造成更全面的影響,包括生成内容安全問題、技術安全、隐私問題、合規問題以及倫理問題等。

張天翼認為,目前大模型存在三方面的風險,一是技術相關問題,模型本身可能被攻擊、被突破、被劫持。二是産業類風險,AI是否會帶來壟斷、勞動替代等問題。三是内容類的問題,是否會向使用者提供不安全的内容。

他表示,大模型的風險問題沒有“靈丹妙藥”,必然是一個長期對抗和博弈發展的過程,“比如說現在安全行業内的一個很直接的應用,我們也會用大模型來對抗更多大模型中的風險,這也會是一個‘用魔法打敗魔法’的方向。”

雲天勵飛副總裁、AI技術平台總經理肖嵘則為生成式AI的發展總結了四個問題,分别是生成内容存在“幻覺”的問題、工具使用和外部知識整合能力、邏輯推理能力和不具備持續學習能力的問題。

在安全問題上,肖嵘認為,大模型其實具備“價值觀”,它所認定的知識不一定就是事實,“解決這個問題其實有兩個路徑,第一個是它為什麼會産生有錯的東西?可能它學的東西都是不對的……是以我們需要對語料有體系地治理,保證其安全、可控。第二個也是我們正在大力推動的,比如對模型輸出的治理。”

但他也強調,AI是一種工具。“越強大的工具被用來作惡,可能影響也越大。”肖嵘說,“我認為,工具用得好不好,更多是人的問題。我們不應該因噎廢食,不是看到強大的工具就不去使用,而是更多地想想怎麼把它有序化。”

本文系觀察者網獨家稿件,未經授權,不得轉載。

繼續閱讀