天天看點

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

2022年,從引爆AI作畫領域的DALL-E 2、StableDiffusion等AI模型,到以ChatGPT為代表的接近人類水準的對話機器人,AIGC不斷刷爆網絡,其強大的内容生成能力給人們帶來了巨大的震撼。學術界和産業界也都形成共識:AIGC絕非昙花一現,其底層技術和産業生态已經形成了新的格局。

就内容生産而言,AIGC作為新的生産力引擎,讓我們從過去的PGC、UGC,已經不可避免地進入AIGC時代。AIGC代表着AI技術從感覺、了解世界到生成、創造世界的躍遷,正推動人工智能迎來下一個時代。

經過了2022年的預熱,2023年AIGC領域将迎來更大發展。AIGC生成内容的類型不斷豐富、品質不斷提升,也将有更多的企業積極擁抱AIGC。在這個背景下,騰訊研究院正式釋出《AIGC發展趨勢報告2023:迎接人工智能的下一個時代》。報告從技術發展和産業生态、應用趨勢、治理挑戰等次元,對AIGC的發展趨勢進行了深入思考。

本文為報告核心内容摘要:

AIGC技術和産業生态迎來發展快車道

AIGC的大爆發不僅有賴于AI技術的突破創新,還離不開産業生态快速發展的支撐。在技術創新方面,生成算法、預訓練模型、多模态技術等AI技術彙聚發展,為AIGC的爆發提供了肥沃的技術土壤。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:AIGC技術累積融合

第一,基礎的生成算法模型不斷突破創新。比如為人熟知的GAN、Transformer、擴散模型等,這些模型的性能、穩定性、生成内容品質等不斷提升。得益于生成算法的進步,AIGC現在已經能夠生成文字、代碼、圖像、語音、視訊、3D物體等各種類型的内容和資料。

第二,預訓練模型,也即基礎模型、大模型,引發了AIGC技術能力的質變。雖然過去各類生成模型層出不窮,但是使用門檻高、訓練成本高、内容生成簡單和品質偏低,遠遠不能滿足真實内容消費場景中的靈活多變、高精度、高品質等需求。而預訓練模型能夠适用于多任務、多場景、多功能需求,能夠解決以上諸多痛點。預訓練模型技術也顯著提升了AIGC模型的通用化能力和工業化水準,同一個AIGC模型可以高品質地完成多種多樣的内容輸出任務,讓AIGC模型成為自動化内容生産的“工廠”和“流水線”。正因如此,谷歌、微軟、OpenAI等企業紛紛搶占先機,推動人工智能進入預訓練模型時代。

第三,多模态技術推動了AIGC的内容多樣性,進一步增強了AIGC模型的通用化能力。多模态技術使得語言文字、圖像、音視訊等多種類型資料可以互相轉化和生成。比如CLIP模型,它能夠将文字和圖像進行關聯,如将文字“狗”和狗的圖像進行關聯,并且關聯的特征非常豐富。這為後續文生圖、文生視訊類的AIGC應用的爆發奠定了基礎。

未來,算法的進步将帶來更多激動人心的應用,語言模型會得到進一步發展,可以自我持續學習的多模态AI将日益成為主流,這些因素會進一步推動AIGC領域的蓬勃發展。

在産業生态方面,AIGC領域正在加速形成三層産業生态并持續創新發展,正走向模型即服務(MaaS)的未來。

目前,AIGC産業生态體系的雛形已現,呈現為上中下三層架構。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

第一層是基礎層,以預訓練模型為基礎搭建的AIGC技術基礎設施層。在國外,以OpenAI、Stability.ai為代表,通過受控API、開源等方式輸出模型能力。

第二層是中間層,是在預訓練模型基礎上,通過專門的調試和訓練,快速抽取形成垂直化、場景化、定制化的小模型和應用工具層,可以實作工業流水線式部署,同時兼具按需使用、高效經濟的優勢。比如,知名的二次元畫風生成模型Novel-AI,以及各種風格的角色生成器等,就是基于Stable Diffusion開源進行的二次開發。随着AIGC模型加速成為新的技術平台,模型即服務(Model-as-a-Service,MaaS)開始成為現實,預計将對商業領域産生巨大影響。

第三層是應用層,依托底層模型和中間層的垂直模型,各廠商進一步開放面向C端和B端使用者的各種各樣的AIGC産品和服務,滿足海量使用者的内容建立和消費需求。例如群聊機器人、文本生成軟體、頭像生成軟體等AIGC消費工具。

目前,從提供預訓練的AI大模型的基礎設施層公司到專注打造垂直領域内AIGC工具的中間層公司、再到直接面對消費者和終端使用者提供産品和服務的應用層公司,美國圍繞AIGC生長出繁榮的生态,技術創新引發的應用創新浪潮疊起;中國也有望憑借領先的AIGC技術賦能千行百業。

AIGC在消費網際網路、産業網際網路和社會價值領域持續産生變革性影響

AIGC領域目前呈現AIGC的内容類型不斷豐富、内容品質不斷提升、技術的通用性和工業化水準越來越強等趨勢,這使得AIGC在消費網際網路領域日趨主流化,湧現了寫作助手、AI繪畫、對話機器人、數字人等爆款級應用,支撐着傳媒、電商、娛樂、影視等領域的内容需求。目前AIGC也正在向産業網際網路、社會價值領域擴張應用。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:AIGC應用現狀概覽(引用自紅杉資本)

在消費網際網路領域,AIGC牽引數字内容領域的全新變革。目前AIGC的爆發點主要是在内容消費領域,已經呈現百花齊放之勢。AIGC生成的内容種類越來越豐富,而且内容品質也在顯著提升,産業生态日益豐富。這其中有三個值得關注的趨勢:

第一,AIGC有望成為新型的内容生産基礎設施,塑造數字内容生産與互動新範式,持續推進數字文化産業創新。過去AI在内容消費領域的作用主要展現在推薦算法成為了新型的傳播基礎設施。推薦算法對數字内容傳播,短視訊為主的數字内容新業态發展,起到了颠覆式的變革作用。而現在,随着AIGC生成的内容種類越來越豐富,内容的品質不斷提升,AIGC将作為新型的内容生産基礎設施對既有的内容生成模式産生變革影響。

第二,AIGC的商業化應用将快速成熟,市場規模會迅速壯大。目前AIGC已經率先在傳媒、電商、影視、娛樂等數字化程度高、内容需求豐富的行業取得重大發展,市場潛力逐漸顯現。比如,在廣告領域,騰訊混元AI大模型能夠支援廣告智能制作,即利用AIGC将廣告文案自動生成為廣告視訊,大大降低了廣告視訊制作成本。巨大的應用前景将帶來市場規模的快速增長,根據6pen預測,未來五年10%-30%的圖檔内容由AI參與生成,有望創造超過600億以上市場規模。也有國外商業咨詢機構預測,2030年AIGC市場規模将達到1100億美元。

第三,AIGC還将作為生産力工具,不斷推動聊天機器人、數字人、元宇宙等領域發展。AIGC技術讓聊天機器人接近人類水準日益成為現實,目前以ChatGPT為代表的聊天機器人已經在刺激搜尋引擎産業的神經,未來人們擷取資訊是否會更多通過聊天機器人而非搜尋引擎?這已經使谷歌等公司面臨的巨大壓力。AIGC也在大大提升數字人的制作效能,并且使其更神似人。比如騰訊AI LAB的虛拟歌手AI艾靈,能夠基于AIGC實作作詞和歌曲演唱。在元宇宙領域,AIGC在建構沉浸式空間環境、提供個性化内容體驗、打造智能使用者互動等方面發揮重要作用。比如,紮克伯格在元宇宙的島嶼上,可以通過發出語音指令生成創造海灘、變換天氣,添加不同的場景等。隻有借助AGIC,元宇宙才可能以低成本、高效率的方式滿足海量使用者的不同内容需求。

在産業網際網路領域,基于AIGC技術的合成資料(synthetic data)迎來重大發展,合成資料将牽引人工智能的未來。MIT科技評論将AI合成資料列為2022年10大突破性技術之一;Gartner也預測稱,到2030年合成資料将徹底取代真實資料,成為訓練AI的主要資料來源。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:合成資料發展預測(來源:Gartner)

合成資料的用途是成為真實世界資料的廉價替代品,用來訓練、測試、驗證AI模型。AIGC技術的持續創新,讓合成資料迎來新的發展契機,開始迸發出更大的産業發展和商業應用活力。這主要展現在以下四個方面:

第一,合成資料為AI模型訓練開發提供強大助推器,推動實作AI 2.0。過去用真實世界資料訓練AI模型,存在資料采集和标注的成本高昂,資料品質較難保障、資料多樣化不足、隐私保護挑戰等多方面問題。而合成資料可以很好的解決這些問題。使用合成資料不僅能更高效地訓練AI模型,而且可以讓AI在合成資料建構的虛拟仿真世界中自我學習、進化,極大擴充AI的應用可能性。從某種意義上也可以說合成資料讓AI模型訓練從1.0階段發展到2.0階段。

第二,合成資料助力破解AI“深水區”的資料難題,持續拓展産業網際網路應用空間。目前,合成資料正迅速向交通、金融、醫療、零售、工業等諸多産業領域拓展應用,幫助破解産業網際網路應用中的資料難題。比如,騰訊自動駕駛團隊研發的仿真系統TAD SIM可以自動生成各種交通場景資料,助力自動駕駛系統測試、開發。在醫療領域,美國國立衛生研究院和合成資料服務商合作,基于其COVID-19病人病曆資料庫,合成了不具有可識别性的替代資料,可供世界範圍内的研究人員自由分享和使用。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:騰訊自動駕駛數字孿生仿真平台

第三,正是由于合成資料對人工智能未來發展的巨大價值,合成資料正加速成為一個新産業賽道,科技大廠和創新企業紛紛搶先布局。目前,全球合成資料創業企業也已經達到100家,英偉達、亞馬遜、微軟等頭部科技企業也在加速布局,湧現了合成資料即服務(SDaaS,synthetic data as a service)這一全新商業模式。

第四,合成資料加速建構AI賦能、數實融合的大型虛拟世界。合成資料指向的終極應用形态是借助遊戲引擎、3D圖形、AIGC技術建構的數實融合的大型虛拟世界。基于合成資料建構的大型虛拟世界,為測試、開發新的人工智能應用,提供了一個安全、可靠、高效以及最重要的是——低成本的、可重複利用的環境,将成為AI數實融合的關鍵載體,包括為AI開發提供資料和場景、試驗田等。比如騰訊開悟的AI開放研究環境,已經吸引了國内外衆多決策智能領域的研究團隊使用。

在社會價值領域,AIGC也在助力可持續社會價值的實作。比如,在醫療健康方面,AI語音生成幫助病人“開口說話”。語音合成軟體制造商Lyrebird為漸凍症患者設計的語音合成系統實作“聲音克隆”,幫助患者重新獲得“自己的聲音”。AI數字人也能幫助老年癡呆症患者與他們可能記得的年輕面孔或者逝去的親人互動。此外,AIGC也可以用于文物修複,助力文物保護傳承。騰訊公司利用360度沉浸式展示技術、智能音視訊技術、人工智能等技術手段,對敦煌古壁畫進行數字化分析與修複。在國外,DeepMind合作開發的深度神經網絡模型Ithaca可以修複殘缺的曆史碑文。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:騰訊利用AIGC技術手段,助力敦煌古壁畫修複

總之,随着AIGC模型的通用化水準和工業化能力的持續提升,AIGC的根本影響在于,将極大降低内容生産和互動的門檻和成本,有望帶來一場自動化内容生産與互動變革,引起社會的成本結構的重大改變,進而在各行各業引發巨震。未來,“AIGC+”将持續大放異彩,深度賦能各行各業高品質發展。

以可信AIGC積極應對科技治理問題與挑戰,擁抱人工智能的下一個時代

發展總是與挑戰并生,AIGC的發展也面臨許多科技治理問題的挑戰。目前,主要是知識産權、安全、倫理和環境四個方面的挑戰。

首先,AIGC引發的新型版權侵權風險,已經成為整個行業發展所面臨的緊迫問題。因版權争議,國外藝術作品平台ArtStation上的畫師們掀起了抵制AIGC生成圖像的活動。其次,安全問題始終存在于科技發展應用之中。在AIGC中,主要表現為資訊内容安全、AIGC濫用引發詐騙等新型違法犯罪行為,以及AIGC的内生安全等。較為著名的案例是,詐騙團隊利用AIGC換臉僞造埃隆·馬斯克的視訊,半年詐騙價值超過2億人民币的數字貨币。再次,算法歧視等倫理問題依然存在。比如,DALL·E 2具有顯著的種族和性别刻闆印象。最後是環境影響,AIGC模型訓練消耗大量算力,碳排放量驚人。此前就有研究表明,單一機器學習模型訓練所産生的碳排放,相當于普通汽車壽命期内碳排放量的5倍。

騰訊釋出AIGC發展趨勢報告:迎接人工智能的下一個時代

圖:騰訊優圖實驗室推出FaceIn人臉防僞産品,能夠自動檢測精準識别視訊、圖像中是否應用人臉僞造技術

為了應對以上挑戰,面向人工智能的下一個時代,人們需要更加負責任地、以人為本地發展應用AIGC技術,打造可信AIGC生态。面對AIGC技術應用可能帶來的風險挑戰,社會各界需要協同參與、共同應對,通過法律、倫理、技術等方面的多元措施支援建構可信AI生态。在立法方面,網信辦等三部門出台的《網際網路資訊服務深度合成管理規定》針對深度合成技術服務提出的要求和管理措施,諸如禁止性要求、辨別要求、安全評估等,亦适用于AIGC。接下來,需要着重從以下方面持續推進AIGC的政策和治理。

其一,政府部門需要結合AIGC技術的發展應用情況,制定并明晰AIGC的知識産權與資料權益保護規則。目前,AIGC的知識産權與資料權益保護規則的不明确,在某種程度上導緻甚至加劇了AI領域的亂象。

其二,研發應用AIGC技術的主體需要積極探索自律管理措施,例如,秉持不作惡、科技向善等目的,制定适宜的政策(消極要求和積極要求),采取控制和安全措施保障AIGC的安全可控應用,采取内容識别、内容溯源等技術確定AIGC的可靠來源。

其三,打造安全可信的AIGC應用,需要深入推進AI倫理治理。例如,行業組織可以制定可信AIGC的倫理指南,更好地支援AIGC健康可持續發展;AIGC領域的創新主體需要考慮通過倫理委員會等方式,推進落實AI風險管理、倫理審查評估等,在AIGC應用中實作“倫理嵌入設計”(ethics by design)。

其四,社會各界需要攜手應對AIGC領域的能源消耗問題,推行綠色AI的發展理念,緻力于打造綠色可持續、環境友好型的AI模型,實作智能化與低碳化融合發展。

未來已來,讓我們擁抱AIGC,擁抱人工智能的下一個時代,打造更美好的未來。

繼續閱讀