經濟觀察網 記者 陳奇傑 馬雲、雷軍、周傑倫、特朗普……這些國内外公衆人物的真實聲音,被一些創作者使用AI音頻應用克隆後,制作成語音角色,并釋出在AI音頻分享社群。使用者隻需幾十秒鐘,便可依靠這些語音角色生成一段接近真人講話音質的AI音頻。
“十一”假期期間,網友制作了大量小米公司創始人雷軍的AI音頻,并在結合畫面合成音視訊後,将此類内容上傳到抖音、快手和B站等網際網路平台,其中不乏罵人、惡搞小米産品的語音,成為輿論熱點。而在9月底,一名犯罪嫌疑人利用AI音頻應用Reecho睿聲(下稱“睿聲”)僞造了三隻羊創始人盧文慶的錄音,更是導緻警方介入調查。
雷軍AI音頻事件發酵後,網際網路平台上的大量相關音視訊被删除,但仍有少量剩餘。經濟觀察網記者在10月13日發現,使用者依然能夠使用睿聲AI音頻分享社群(下稱“睿聲社群”)裡名為“雷軍”的語音角色制作音頻,一個“雷軍”語音角色已被使用60.3萬次。
睿聲是深圳市言域科技有限公司(下稱“言域科技”)旗下的AI音頻應用和分享社群。言域科技創始人謝偉铎告訴經濟觀察網,小米法務方面已與該公司取得聯系,希望其能對社群中涉及雷軍的音頻内容進行管控。目前,言域科技已通知原作者下架相關内容,如果原作者在7個工作日内沒有下架,該公司會進行強制删除。
AI音頻制作者、語音角色創作者、AI音頻應用和分享社群、網際網路平台,共同構成了制作公衆人物AI音頻的上下遊鍊條。當此類音頻引發負面輿情時,鍊條上的涉事各方分别需要承擔什麼責任?被侵權人能否利用現有技術精準追溯到肇事方?
制作者的責任
目前,AI音頻制作者主要通過兩種形式生成公衆人物的音頻。
第一種方式為,AI音頻制作者直接使用AI技術提供方的技術生成音頻。謝偉铎說,此前,合肥警方通過網際網路平台溯源找到了僞造盧文慶錄音的犯罪嫌疑人,在其電腦上看到了使用睿聲的記錄。言域科技配合警方調取了該嫌疑人的生成記錄以作證據。
言域科技方面披露,該嫌疑人截取了盧文慶在直播中大約30秒的情緒較為飽滿的音頻作為素材,并用自己編撰的文本在睿聲的平台上進行合成。其後,該嫌疑人在一個較為嘈雜空曠的環境中,播放合成後的音頻,并用其他錄音裝置分段做翻錄及拼接。這一操作增加了環境氛圍感,導緻衆多網友難以區分該錄音是真實還是僞造。
第二種方式為,創作者上傳公衆人物的真實聲音,克隆出接近其聲音的語音角色,并分享至AI音頻分享社群上,其他制作者可以直接使用此類語音角色再生成AI音頻。相比前一種,第二種生成AI語音的方式更加便捷。
經濟觀察網記者在睿聲社群中選擇一個名為“雷軍”的語音角色,輸入200個字元的文字,點選生成音頻。不到一分鐘,一段仿造雷軍講話的AI音頻就被制作出來。
截至10月13日,睿聲社群的一個“雷軍”語音角色,被使用次數為60.3萬次,生成字元數為3371.8萬個;在AI音頻應用Fish Audio上,一個“雷軍”語音角色被使用了17.4萬次。
網友在制作公衆人物的AI音頻時,往往不會注意此類行為需要得到授權,一位B站使用者說,他隻是看到很多人合成雷軍的AI音頻,于是萌生了制作雷軍AI語音解說遊戲視訊的想法。另一位制作了類似視訊的B站使用者稱,“(這種視訊)網上很多,應該沒事,有提示違規我就删”。
泰和泰律師事務所律師杜雙告訴經濟觀察網,根據現有司法判定标準,高度可識别的AI生成聲音受到法律保護。AI配音素材提供者、視訊制作者未經雷軍本人或小米公司授權,将其AI生成的聲音用于制作、傳播具有辱罵、诽謗性質的音視訊内容,本身已構成對雷軍肖像權、名譽權等多項人格權侵權,甚至會侵犯小米公司的名譽。
技術提供方的義務
在前述兩種AI音頻制作方式中,AI音頻應用公司扮演了不同的角色。在第一種方式下,他們僅充當AI技術提供方。在第二種方式下,他們則具備AI技術提供方和營運方的雙重屬性。
言域科技創始人謝偉铎認為,AI應用隻是内容轉化的工具,在内容把控方面,更優先的選項是由使用者負責。作為使用者生成内容(UGC)社群,在合法合規的情況下,言域科技并不願過度幹預使用者生産的内容。
是以,言域科技主要通過提示使用者和内容溯源的形式,進行合規經營。
言域科技在官網上提醒使用者,請勿使用其服務克隆或生成任何侵犯版權、違反道德倫理或違反中華人民共和國法律法規的内容。
三隻羊僞造錄音事件後,言域科技回應稱,其正在部署包括強化的實名認證機制,強化的敏感詞多元度智能偵測預警,以及可溯源音頻水印等多重安全措施。
謝偉铎說,現在使用者使用睿聲生成的所有内容都可以被溯源到,能溯源到的資訊包括技術平台以及内容制作使用者等。
内容可溯源是監管方面對AI技術提供方和營運方的要求。全國資訊安全标準化技術委員會秘書處去年8月釋出的《網絡安全标準實踐指南—生成式人工智能服務内容辨別方法》稱,由人工智能生成圖檔、音頻、視訊時,應在生成内容中添加顯式水印和隐式水印辨別。
杜雙稱,根據《網際網路資訊服務深度合成管理規定》(下稱《管理規定》),AI技術提供方還擁有加強訓練資料管理、保障訓練資料安全、保護個人資訊等義務。同時,對提供人臉、人聲等生物識别資訊編輯功能的,應當提示技術使用者依法告知被編輯的個人,并取得其單獨同意。
經濟觀察網注意到,一些創作者制作的“馬雲”“周傑倫”“特朗普”“蔡徐坤”等語音角色,被釋出在睿聲社群的首頁上,并且可以被未注冊使用者看到。此時,這些公衆人物的語音角色成了AI音頻應用公司吸引流量的工具。
杜雙說,這種情形下,制作語音角色的創作者已經構成侵權。AI音頻分享社群如果發現侵權行為或者權利人投訴舉報,需要及時删除下架相關素材。如果不及時删除,AI音頻分享社群需要承擔一定的侵權責任。
謝偉铎說,目前睿聲正在和一些配音演員合作,考慮推出高品質的官方角色。未來可能也會在驗證過版權的情況下,開展使用者出售聲音版權的業務。
平台:寄望于使用者辨別
在本次雷軍AI音頻事件中,抖音、快手和B站等網際網路平台是主要傳播管道。面對越來越多的AI生成内容,網際網路平台有何責任?
杜雙說,作為傳播管道的平台方,同樣受《中華人民共和國網絡安全法》《管理規定》規制,針對可能導緻公衆混淆或者誤認的深度合成技術,應當在生成或者編輯的資訊内容的合理位置、區域進行顯著辨別,向公衆提示深度合成情況。
目前,主流社交平台對AI内容采取的措施,一般是先讓使用者做出聲明,并在AI生成的内容旁标注類似于“本内容為AI生成”辨別。
經濟觀察網從快手方面了解到,其在2023年9月上線了AI内容作者聲明功能,并要求使用者在釋出人工智能生成内容時,務必添加作者聲明,避免AI内容在傳播過程中帶來誤解。
B站、抖音等視訊内容平台同樣采取了類似的措施。例如,抖音在使用者服務協定中提到,使用者不得利用基于深度學習、虛拟現實等的新技術新應用制作、釋出、傳播虛假新聞資訊資訊。使用者在釋出或傳播利用基于深度學習、生成式人工智能等新技術新應用制作的非真實音視訊資訊,或其他可能導緻公衆混淆或誤認的資訊内容時,應當以顯著方式予以辨別。
對于未以顯著方式辨別的AI生成内容,B站的使用者協定還進一步提示,B站“有權對相關内容和賬戶采取包括但不限于增加辨別、限制、封禁等措施”。
但經濟觀察網記者為抖音、B站上傳一段AI音視訊後發現,在不主動選擇對該音視訊作出标注的情況下,兩家平台都沒有檢測出該音視訊為AI生成。
一家AI鑒僞公司的高管曾接觸過網際網路平台。在他看來,出于自身成本及監管力度等綜合原因,目前網際網路平台對AI僞造内容的管理意願還不高。