“衆所周知，視訊不能P”，GAN：是嗎？

見過用GAN來P圖，見過用GANP視訊嗎？

瞧，原本一直在面無表情地講話的人，全程露出了微笑；原本得4、50歲的人，直接變20幾歲了：

另一邊，正在微笑唱歌的“赫敏”一下子憤怒起來，還能換上一張幾歲小孩的臉：

奧巴馬也如此，4種版本的面部狀态信手拈來，甚至連性别都給P成女的了：

不管人臉表情和狀态如何變化，這些視訊都沒有給人任何違和感，全程如此的絲滑～

哦對，除了真人，動漫視訊裡的臉也可以P：

有點厲害了。

基于GAN的視訊面部編輯

這個模型出自以色列特拉維夫大學。

衆所周知，GAN在其潛空間内編碼豐富語義的能力，已經被廣泛用于人臉編輯。

不過将它用在視訊中還是有點挑戰性：一個是缺乏高品質資料集，一個是需要克服時間一緻性（temporal coherency）這一基本障礙。

不過研究人員認為，第二點這個障礙主要是人為的。

因為原視訊本具備時間一緻性，編輯後的視訊卻變了，部分原因就是在editing pipeline中對一些元件（component）處理不當。

而他們提出的這個視訊人臉語義編輯架構，相對于目前技術水準做出了重大改進：

隻采用了标準的非時序StyleGAN2，對GAN editing pipeline中的不同元件進行分析，确定哪些元件具備一緻性，就用這些元件來操作。

整個過程不涉及任何用來維持時間一緻性的額外操作。

具體流程一共分為六步：

1、輸入視訊首先被分割成幀，每幀中的人臉都被裁剪下來并對齊；

2、使用預訓練的e4e編碼器，将每張已裁剪的人臉反演到預訓練的StyleGAN2的潛空間中；

3、在所有并行幀中使用PTI（最新提出的一種視訊人臉編輯方法）對生成器進行微調，糾正初始反演中的錯誤，恢複全局一緻性；

4、所有幀通過使用固定的方向和步長，線性地操縱其軸心潛碼（pivot latent codes）進行相應編輯；

5、再次微調生成器，将背景和編輯過的人臉“縫合”在一起；

6、反轉對齊步驟，并将修改後的人臉粘貼回視訊中。

△ 注意頸部曾産生了大量瑕疵，在最後一步完全修複好

和SOTA模型對比

這個模型效果到底有多好，來個對比就知道：

第一個是變年輕、第二、三個都是變老。

可以明顯看到目前的SOTA模型（Latent Transformer）和PTI模型中的人臉會“抽巴”，并出現一些僞影，而這個新模型就避開了這些問題。

此外，研究人員還進行了時間一緻性測試。

名額包含兩個：

局部時間一緻性（TL-ID），通過現成的一緻性檢測網絡來評估相鄰兩幀之間的一緻性。TL-ID分數越高，表明該方法産生的效果越平滑，沒有明顯的局部抖動。

全局時間一緻性（TG-ID），同樣使用一緻性檢測網絡來評估所有可能的幀（不一定相鄰）之間的相似性。得分為1表示該方法成功保持了和原視訊的時間一緻性。

結果如下：

可以看到，這個新模型在兩項名額中都略勝一籌。

最後，代碼将于2月14号釋出，感興趣的朋友可以蹲一蹲了～

“衆所周知，視訊不能P”，GAN：是嗎？

繼續閱讀

微調疊代僅500次，大眼萌生成效果超越StyleGAN，可線上試玩

萬物皆可JOJO：這個GAN直接讓馬斯克不做人啦｜Demo可玩

小米67W Gan小布丁充電器上架，圓潤小巧售價149元

魅藍30W GaN Mini充電器、雙Type-C快充線釋出：49元起

意法半導體推出全新G-HEMT系列GaN功率半導體産品

聚燦光電：目前公司生産經營正常，滿産滿銷

一周概念股：手機市場增長受制俄烏沖突，GaN器件車用落地仍有待突破

向單晶片的GaN器件進軍

斯坦福學生攻破兩個約會軟體！用GAN模型“女扮男裝”騙過人臉識别系統

vivo 公布新款 80W GaN PD 充電器：雙 C 口，可折疊

聯想釋出新款65W口紅電源：第三代GaN技術體積再小一半

售價69元！黑鲨星流GaN30W充電器上架京東開賣

紫米推出新款GaN3充電器：迷你身材，最高30W功率

原畫師驚呆：這個爆火AI真把夢境畫成現實了！下載下傳APP人人可用

不讓居家辦公了？GAN之父Ian Goodfellow憤而從蘋果離職