人人都能做的AI換臉視訊，為什麼能騙到科技從業者？

每經記者：宋美璐每經編輯：張海妮

福州某科技公司法定代表人9分鐘被AI換臉騙430萬元的風波剛過，又有安徽何先生9秒被換臉騙走245萬元。

另一邊，直播間中，換上楊幂、迪麗熱巴等明星臉的主播出現在直播間帶貨，讓觀衆真假難辨。

疑似換臉楊幂的帶貨主播圖檔來源：視訊截圖

社交網站的示範視訊中，手一揮一秒換臉的視訊比比皆是，每個人都能用AI制作一段視訊，騙子也不例外。

AI音樂、AI繪畫、AI換臉、AI換聲……不知不覺中，我們每個人都已經走進了賽博世界，不管是抖音中的#一鍵解鎖瞬息全宇宙##一鍵變妝#等特效的應用還是AI孫燕姿的“消費”，都是AI日常化的見證。

在所有人都在享受技術狂歡的時候，技術的另一面也逐漸顯露：僞造技術和鑒别技術好似在玩一場“貓鼠遊戲”，最終誰能把握主動權？

可以批量生産的AI換臉，技術門檻有多低？

AI換臉技術并非新事物，早在2019年，一個換臉軟體“ZAO”的出現，就曾讓AI換臉風靡網絡，網絡視訊平台上出現大量的AI換臉惡搞視訊，許多明星是以被惡搞、造謠。

盡管，當時“ZAO”上線不久便因侵犯隐私等問題被下架，但這個由技術帶來的負面影響卻一直存在，直到今年AI技術的普及使得換臉再次爆發。

瑞萊智慧RealAI聯合創始人、算法科學家蕭子豪表示，AI換臉、AI換聲主要使用的是深度合成技術，随着深度合成技術的開源開放、深度合成産品和服務的增多，深度合成内容制作的技術門檻越來越低，實作了技術的“平民化”，普通人也能用少量圖像、音頻等樣本資料，利用簡便易用的合成工具，制作深度合成内容。

蕭子豪介紹，目前視訊聊天或直播的AI換臉有兩種方式：一種是事先做好的換臉視訊直接播放，一種是接入實時換臉的視訊。第一種方式，目前的制作成本已經非常低，有公開成熟的應用可以支援該項工作；第二種雖然沒有發現有公開的應用，但也有非常成熟的技術手段可以支撐。做成一段視訊的時間和裝置、算力等因素相關，目前技術可以做到和生成視訊相等的時間即産出結果。制作這樣的視訊需要被替換前的原始視訊圖像和被替換後的人臉圖像，基于目前的技術能力，替換前的原始視訊圖像在面部清晰、正臉無遮擋、無誇張動作等條件下，會展示出比較好的效果。

AI從業人員湯輝也表示，現在的AI換臉對技術的要求非常低，“如果是專門的技術人員，在網上找一個開源的模型，然後先自己搞懂。如果隻是采集一段這個人的圖像生成視訊，很快就能訓練出來。20分鐘就可以做一個。”

在手機應用商店搜尋“AI換臉”可以發現，有不少相關軟體，其中faceplay在ios系統的下載下傳量已達24萬，該軟體有影視角色、寫真、漫畫等模闆。軟體采取收費擷取模版的形式盈利，周會員17元，年會員398元。也有的軟體隻需看廣告就可以制作。

換臉軟體faceplay下載下傳和收費界面圖檔來源：截圖

電商平台上雖已屏蔽“換臉”等關鍵詞，但通過搜尋其他相關詞條仍能找到相關内容，售價多在幾十元。

某電商平台售賣AI換臉産品的詳情介紹圖檔來源：網頁截圖

抖音等短視訊也推出簡易AI換臉模闆，比如換臉跳舞、變臉換裝、男女換臉等。記者嘗試導入照片後幾秒鐘便可生成一個視訊，但這類視訊精度相對較低，偶爾轉頭還可以看到一些不貼合等漏洞。

此外，許多大型科技公司也在着力布局相關業務，AI概念股萬興科技（SZ300624，股價136.60元，市值188.09億元）落地了AI換臉、AI摳像、AI降噪、AI音頻重組等多項AI能力。據媒體報道，5月25日萬興科技旗下的萬興播爆已全面上線AI數字人定制服務，支援數字人形象定制、聲音複刻和視訊模闆定制。使用者隻需錄制一段6分鐘左右的視訊和20句有效音頻語料素材，便可生成“真人”“真聲”專屬數字人。

“目前AI已經可以批量制作大量的視訊，制作多段替換成同一人物的視訊，也可制作同時替換為多位人物的視訊。”蕭子豪說。

為AI打标記，一場“貓鼠遊戲”

“技術隻會發展得越來越快，也許你現在能看出來是AI，還是真人，但是半年後，一年後呢？”湯輝認為AI技術發展太快，但是現實生活中了解AI的人又太少，進而導緻詐騙頻繁發生。

蕭子豪也表示，目前深度合成技術在不斷進化，生成的聲音和視訊越來越逼真，普通人肉眼鑒别的難度也越來越高。

據媒體報道，微軟首席技術官（CTO）凱文·斯科特在當地時間5月23日開幕的Build開發者大會前夕接受采訪時曾表示，微軟3年來一直在研究“媒體來源系統”——在AI生成的内容裡放置加密水印，可以使用軟體解密水印以擷取來源資訊，以檢測虛假資訊。

從技術上來看，蕭子豪介紹，他們一直在研究深度合成技術的自動化檢測，常用的方法包括基于僞造内容資料集完成對模型檢測器的訓練、基于幀間不一緻性實作對僞造内容的判别等，這些方法在開源資料集中均能達到99.9%的準确率。

“防範的難度在于新型僞造方法層出不窮、網絡傳播環境日趨複雜，加上基于深度神經網絡的檢測算法存在結構性缺陷等，反深僞檢測技術也面臨‘強對抗性’，需要持續更新與疊代優化。”

類似于“貓鼠遊戲”，蕭子豪說，深度合成和檢測在不斷學習攻防過程中會自我進化，規避上一代的對抗技術。為了能在對抗攻防中掌握主動權，未來反深僞檢測技術的發展需融合多模态内容的驗證分析、基于數字水印的溯源技術等多方面能力，實作僞造内容的精準識别，打造可信内容體系。

《網際網路資訊服務深度合成管理規定》明确要求深度合成服務提供者對使用其服務生成或者編輯的資訊内容，應當采取技術措施添加不影響使用者使用的辨別，對于具有生成或者顯著改變資訊内容功能服務的，應當在生成或者編輯的資訊内容的合理位置、區域進行顯著辨別，向公衆提示資訊内容的合成情況，避免公衆混淆或者誤認。

記者注意到，目前b站已經在一些視訊上為AI合成視訊打上明顯标記，抖音在5月9日釋出了關于AI生成内容的平台規範暨行業倡議，倡議各生成式人工智能技術的提供者，均應對生成内容進行顯著辨別，以便公衆判斷。同時使用統一的人工智能生成内容資料标準或中繼資料标準，便于其他内容平台進行識别。

B站AI技術合成辨別圖檔來源：截圖

蕭子豪建議，普通人如果遇到有疑問的情況，可以在看視訊時有意識地引導對方做一些動作，如：大幅度的搖頭或張嘴。如果騙子技術手段較弱，那麼就有可能發現對方面部邊緣或者牙齒的瑕疵，進而識别出AI換臉。但同時他也表示，這個方法對于識别出“高水準”的詐騙分子，還存在難度。此外，還可以追問幾個隻有你與借款者之間才知道的私密資訊，來核實對方身份。

AI換臉有風險

根據著作權法的有關規定，如果AI換臉使用的是表演者的視訊素材，還可能侵犯其著作權。如果是非法使用，例如本案中的行為人冒用郭先生好友的微信，利用AI換臉詐騙，則不僅構成侵權，還涉嫌犯罪。

如果在直播中使用AI換臉服務，直播商家、平台方和技術提供方都将承擔一定的責任。尤其根據《網際網路資訊服務深度合成管理規定》，如果深度合成服務提供者和技術支援者違反規定的，相關部門會給予處罰；構成犯罪的，還要承擔相應的刑事責任。

此外，北京市京師律師事務所王榮梅律師團隊提醒，關于AI生産的内容版權歸屬問題，目前也還存在争議。

首先，AI生成的内容是否構成作品就存在争議；其次，在實務中，AI生成物的性質認定也存在争議。是以目前法律沒有就AI生成内容的版權作出明确規定，但是在《生成式人工智能服務管理辦法（征求意見稿）》第五條中，規定了此類内容侵權的主體責任。即利用生成式人工智能産品提供聊天和文本、圖像、聲音生成等服務的組織和個人，包括通過提供可程式設計接口等方式支援他人自行生成文本、圖像、聲音等，承擔該産品生成内容生産者的責任。

“目前，AI還是一個新興的領域，發展日新月異，在為人們的工作和生活帶來便捷的同時，也有不法分子利用此技術從事違法犯罪活動，目前，AI領域的規定散見于民法典、個人資訊保護法、網絡安全法，尚未形成系統的法律體系。相信随着此技術的廣泛應用，法律法規也會不斷與時俱進，國家會出台更多的規範措施，逐漸形成完備的法律體系。”王榮梅律師團隊說。

每日經濟新聞