天天看點

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

智東西(公衆号:zhidxcom)

作者 | ZeR0

編輯 | 漠影

智東西2月22日報道,近年來,視訊換臉、合成語音、修複影像、虛拟數字人等越來越頻繁的出現在社交娛樂、影視制作、教育、廣告營銷等領域,發展出多元化的商業應用。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

▲由朱茵飾演的黃蓉被換成楊幂的臉

這些應用的背後,是深度合成技術在發揮作用。

深度合成技術,是指用以深度學習、虛拟現實為代表的生成合成類算法,制作文本、圖像、音頻、視訊、虛拟場景等資訊的技術。

而在使用需求不斷湧現的同時,部分惡意利用該技術生成的音視訊,如篡改人臉的色情視訊、僞造人臉視訊破解身份核驗等應用,不僅給個人、企業造成了聲譽損害和财産損失,也對社會、國家安全造成威脅。

為了對人工智能和深度合成技術的健康發展提供參考和指引,清華大學人工智能研究院、北京瑞萊智慧科技有限公司、清華大學智媒研究中心、國家工業資訊安全發展研究中心、北京市大資料中心近日聯合釋出《深度合成十大趨勢報告(2022)》(以下簡稱《報告》)。

《報告》從技術研究、領域應用、發展趨勢等多個方面,全面深入地介紹和研判深度合成技術及應用帶來的機遇與挑戰,并就其發展與治理給出切實可行的建議和措施。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

一、落地多領域,深度合成内容迎爆發式增長

深度合成的圖像、視訊、音頻、文本等内容,例如熱門影視劇片段、話題明星的換臉視訊等等,具有極強的娛樂性與傳播性。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

▲深度合成技術進行視訊“換臉”處理

随着技術日臻成熟,越來越多創作者在網際網路上釋出和分享深度合成内容,數量逐年高速增長。

《報告》顯示,在國内外主流音視訊網站、社交媒體平台上,2021年新釋出的深度合成視訊數量較2017年已增長10倍以上。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

其中,深度合成視訊數量最多的類型是影視音樂,涉及電影、電視劇、音樂等内容;第二是科技教育,此類視訊關注對深度合成技術的講解和讨論,分享最新的研究成果等。排名第三到第五的視訊類型分别是生活、娛樂和資訊類。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

▲“AI修複百年前北京城2.0”視訊片段

用流暢手語解說北京冬奧會谷愛淩奪冠的手語AI合成主播“小聰”、登上2021年央視春晚的虛拟偶像洛天依等虛拟數字人均應用了深度合成技術。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

在影視制作領域,深度合成技術已經成為受劣迹藝人行為拖累的作品的救場工具,《長安十二時辰》、《光榮時代》等影視作品均采用這一技術。

與此同時,深度合成内容的關注度也呈指數級增長,通過對互動資料進行統計,2021年新釋出的深度合成視訊的點贊數已超過3億。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

此前“英國女王發表聖誕賀詞”、“阿湯哥表演硬體魔術”等一系列深度合成視訊曾火爆“出圈”,引發平台使用者大量熱讨。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

▲英國Channel 4制作了惡搞版女王聖誕緻辭

瑞萊智慧CEO田天表示,研究論文的持續增加、開源技術工具和大量代表性方法的湧現,令深度合成内容的效果更加逼真、制作也更加高效,尤其是生成對抗網絡(GAN)等算法的出現,讓合成内容達到了“真假難辨”的程度。

相關資料顯示,2017年以來深度合成領域的論文數量正持續增長。其中針對圖像類生成視訊的研究占比最高,達到64%,音頻和文本占比分别為12%和24%。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

一些面向公衆開發的合成類産品也陸續推出,視訊、語音和文本形式的服務最為普遍。

例如支援風格定制的特效視訊制作軟體等風靡網絡;語音方向衍生出了語音導航、有聲讀物、自動新聞播報等應用;文本合成則在新聞報道、詩文創作、聊天問答等方面發揮着重要作用。

深度合成技術還極大地豐富了虛拟數字空間的資訊内容,為“元宇宙”等新商業思維提供支撐。

阿裡巴巴安全感覺與認知智能部負責人薛輝說,比如虛拟人、數字人即是深度合成的主要應用,也是“元宇宙”的重要組成部分。

清華大學新聞與傳播學院常務副院長陳昌鳳認為,深度合成将重新定義虛拟數字化空間,從傳播社會學意義上看,一個新的人類生存場景将以深度合成技術為基石展開。

二、風險加劇,技術檢測成重要應對舉措

深度合成激發了新内容創造力的同時,也帶來了新的威脅。

2017年。名為“Deepfakes”的使用者利用深度合成技術制作的成人視訊在Reddit社群中瘋狂傳播,迫于公衆輿論壓力,Reddit網站将該使用者封号。

該使用者随即在全球最大代碼開源平台GitHub上公開了實作該技術的源代碼,瞬時引發了技術愛好者的廣泛關注與讨論,并引爆了創造和豐富深度合成相關技術項目及代碼的風潮。

統計資料顯示,2017年以來,深度合成領域的開源項目釋出數量持續增長。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

以圖像、音頻、文本方向中具有代表性的5個開源項目(分别可實作面部替換、動作或表情操縱、圖像生成、聲音複刻、文本生成)為例,其Star數量在2021年均已突破1萬。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

随着技術普及,不法分子可輕易僞造音頻、視訊,實施誣陷、诽謗、詐騙、勒索等違法行為,甚至捏造國家政要言論擾亂社會與政治秩序。

例如在2018年4月,有技術團隊制作了美國前總統奧巴馬的換臉視訊,視訊中的假“奧巴馬”罵當時任美國總統的特朗普是“徹頭徹尾的白癡”。

2021年10月,安徽合肥警方曾查獲一起非法利用深度合成技術僞造手機使用者人臉動态視訊破解身份核驗,為黑灰産業提供注冊虛拟手機卡等技術支撐的案件。近年來,類似事件開始更多的進入公衆視野。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

深度合成内容模糊了真實和虛假的邊界,将對社會信任、媒體信任、政治信任産生巨大的影響。

陳昌鳳認為,虛假内容的高難度甄别影響了事實核查的有效性,在社會重大事件或政治事件節點上,深度合成技術可能被用于操作輿論意見,借助社交媒體,使虛假資訊短時間内引發産生病毒式擴散,激化社會沖突。

負面風險不斷加劇,如何有效甄别深度合成内容就成為了關鍵,但随着合成品質的不斷提升,傳統基于生物特征的鑒别方式越來越難發揮作用。

在浙江大學網絡空間安全學院院長任奎看來,目前對深度合成的檢測主要依賴于人工智能模型,依賴于訓練資料的完備性,包括檢測器泛用性低、公開資料集适用性、資料敏感等,這些都将帶來諸多挑戰。

中國工程院院士邬賀铨認為,深度合成的治理有兩項要點。第一,要持續發展技術,不能“一刀切”地禁止,避免阻礙正向應用與創新。第二,衍生出的安全問題要從源頭上解決,利用技術創新、技術對抗等方式,持續提升和疊代檢測技術的能力。

田天也談道,新型僞造方法層出不窮、網絡傳播環境的日趨複雜,加上基于檢測算法存在漏洞缺陷等,反深僞檢測技術面臨“強對抗性”,需要持續更新與疊代。

《報告》顯示,目前學術界和産業界均已對反深僞檢測投入了大量研究,Meta、谷歌、微軟等機構均推出了深度合成視訊認證的方法或産品。

在國内,清華大學、中科大等高校在深度僞造内容檢測方面取得顯著成果。

清華大學孵化團隊瑞萊智慧RealAI、騰訊優圖實 驗室等企業機構已建構人臉合成檢測平台并釋出針對性的檢測産品,支援對多種換臉方法進行檢測。例如,瑞萊智慧推出的深度僞造内容檢測平台DeepReal擁有工業級的檢測性能和應對實網環境對抗變化的檢測能力。

清華大學人工智能研究院基礎理論研究中心主任朱軍認為,深度合成檢測面臨持續的攻防和博弈,未來還需融合多模态内容的驗證分析、基于數字水印的溯源技術等多方面能力,實作精準識别。

三、建構多元度治理機制,引導技術良性發展

深度合成技術的良性發展,離不開多元度治理機制的探索。

《報告》顯示,除了發展深度僞造内容檢測技術以外,近幾年來,針對深度合成技術惡意使用所帶來的挑戰,世界各國紛紛出台相關法律法規,探索深度合成的治理路徑。

國際方面,美國從聯邦和州層面進行專門立法,歐盟将深度合成納入《通用資料保護條例(GDPR)》等現有法律架構規制。此外,德國、新加坡、英國、南韓等國家,均有适用于深度合成技術相關犯罪案件審理的法律法規。

大陸也在積極探尋有效的治理機制。

2019年11月起先後出台的《網絡音視訊資訊服務管理規定》、《網絡資訊内容生态治理規定》、《中華人民共和國民法典》、《網際網路資訊服務算法推薦管理規定》,均對生成合成類内容等提出了不同程度的監管要求。

今年1月,國家網信辦公布了《網際網路資訊服務深度合成管理規定(征求意見稿)》,對深度合成内容的用途、标記、使用範圍以及濫用處罰作出了具體規定。

AI換臉、合成語音爆發式增長!清華釋出《深度合成十大趨勢報告》

對于深度合成内容治理路徑的探索,陳昌鳳認為可以從技術、倫理與法制等幾個方面努力,技術方面,通過政府與社會組織參與、協同治理;倫理方面,确立和倡導相關的深度合成原則。

中國社科院哲學所科技哲學研究室主任段偉文建議,對深度合成技術引發的社會、法律和倫理問題,應展開有系統性、前瞻性的跨學科研究,對其可能出現的高風險應用場景,進行有針對性的治理與監管。

中科院自動化所研究員、聯合國教科文組織AI倫理特設專家組專家曾毅則倡導産研發展自律自治,在他看來,在法律法規不完全成熟及體系化之前,産業界自身應強化“理論先行”意識,作為産業共同體共同防範濫用、嚴禁惡用。

對外經濟貿易大學法學院副教授許可談道,社會層面應加大宣傳普及力度,強化公民對深度合成等人工智能技術的認識,提高全社會的防範意識,推動公民作為負責任的深度合成技術的使用者,主動辨別合成内容并積極踐行社會監督。

對此,田天也有類似的觀點,深度僞造的本質問題是透明度不足,是以提高公衆對深度合成技術的認知尤為重要,隻有将門檻降低到所有閱聽人能夠在共同的架構下去認識、讨論、了解這個問題的時候,深度合成技術才能健康良性發展。

結語:深度合成急需有法可依

總體來看,随着深度合成技術逐漸成熟,合成過程更加高效、内容更為逼真,越來越多的相關正向應用正産生豐富的商用價值。同時面對目前技術仍存在的不安全隐患,檢測深度僞造的技術還需持續研究與疊代。

《報告》提出建議,監管部門需提前進行前瞻布局,在保護深度合成技術良性發展的基礎上,制訂針對不良深度合成引用的配套法規,管理條例;同時各方應與時俱進落實好新的規範要求,并在此前提下不斷追求技術突破,不斷開拓深度合成技術應用場景,創立示範标杆,形成對人工智能行業整體的帶動效應,進而促進新技術的持續健康發展。

繼續閱讀