天天看點

革字幕,鼎配音,AI這次玩大了

作者:機器之能
革字幕,鼎配音,AI這次玩大了

如果大規模部署這種人工智能,它将破壞工作室、内容創作者和制作人的遊戲規則。這幾乎是不可避免的。

編寫|微脂肪

2020年,南韓電影《寄生蟲》斬獲奧斯卡最佳影片、最佳導演、最佳原創劇本、最佳國際電影,改寫了電影史。

"一旦你克服了一英寸高的字幕障礙,你會看到更多偉大的電影,"導演馮俊晖在獲獎感言中說。

革字幕,鼎配音,AI這次玩大了

《寄生蟲》獲得最佳影片獎,成為奧斯卡曆史上第一部獲得該獎項的非英語電影。

早在《寄生蟲》之前,一些外語片就突破了字幕的障礙,在好萊塢主流中大獲成功。但這并不影響字幕作為障礙的真實存在。

在流媒體之外,國際電影和電視節目仍在努力吸引觀衆。到2020年,隻有12部電影将在美國1000多家影院上映。在《寄生蟲》之前,最後一部是2006年李連傑的《無畏》。

事實上,《寄生蟲》首次上映時,奧斯卡最佳影片獎得主隻在三家影院上映。正如它的成功所表明的那樣,一部偉大的電影應該吸引觀衆,無論它使用什麼語言。然而,許多獲獎或提名的字幕電影很少能獲得100萬美元的票房。

革字幕,鼎配音,AI這次玩大了

李安的《卧虎藏龍》斬獲四項奧斯卡獎,票房收入1.28億美元。

在地球的另一端,作為全球最大的電影市場,中國的觀衆不得不在字幕上花大價錢。目前,許多電影院采用進口電影,甚至不再排定中國版。

革字幕,鼎配音,AI這次玩大了

以最近熱播的《失控的玩家》為例,筆者在商圈所有影院,所有場景都隻有英文版。

人類通常閱讀速度比聽到的要慢,有多少人天生就更喜歡字幕而不是畫外音?幾十年來,娛樂業一直試圖通過在電影、遊戲、廣告和電視節目中配音配音來尋找全球市場。但這是一個漫長而昂貴的過程,伴随着脫節甚至盜版的觀衆體驗。

神經網絡的興起正在悄然改變全球文化消費的傳統方式。機器想要一個"勇敢的新世界"。所有語言都是"一等公民",沒有一寸字幕,甚至沒有人類畫外音,你可以像欣賞長安的12小時一樣觀看"東區噩夢"。最終,最佳國際電影獎可能會消失,奧斯卡隻是變成了一個無國界的獎項。

01 誰在做大蛋糕?

技術商業化的興起始終離不開一個基本前提——市場。誰需要它?誰創造了需求?這個需求有多大?

翻譯是必要的,因為非英語内容需求有很大的市場。Netflix在為非英語内容創造新的全球市場方面做得很好。你知道,五到十年前,全球市場對非英語内容沒有需求。

成立于20多年前,久經沙場的Netflix能夠擁有今天的市場地位,當遠征海外時,功不可沒。該公司自2011年以來一直在海外擴張,2013年熱門電影《紙牌屋》的巨大成功不僅加強了公司原創性的戰略重要性,也認識到美國訂戶增長的局限性Netflix正在投入大量資金購買本地語言的原創内容。

國産劇《毒枭》、英劇《王冠》、德劇《黑暗》、西班牙《紙屋》成就"爆款"、葡劇《3%》、法國劇《馬賽城》、日劇《火花》引起轟動,無不可見海外市場觀衆已經成熟,但市場缺乏适合本土内容的。

目前,Netflix的原創内容中有很大一部分是非英語内容,超過60%的付費使用者來自海外。在其2020年第四季度業績中,該公司宣布其最近的訂戶收益的絕大部分來自國外。

Netflix的商業模式,全球訂閱視訊點播(SVOD),隻有在跨地區分發内容時才真正有意義,而現在最大的障礙之一是本地化。

Netflix也盡最大努力說服觀衆克服字幕障礙,觀看外語電影。為了更好地在海外發行,他們在平台的内容中添加了28種語言的字幕。

"我們看到越來越多的訂戶選擇超越國界和文化的電視和電影節目。Netflix發言人告訴《紐約時報》。

這位發言人還指出,字幕并沒有阻止好的内容在Netflix上被喜歡和欣賞。比如Netflix原版劇集《毒枭》既有英語場景,也有西班牙語場景,劇集又續播了一季又一季。

革字幕,鼎配音,AI這次玩大了

Netflix 原創劇集《毒枭》

随着蛋糕越來越大,競争越來越激烈,Netflix将面臨更加激烈的競争。美國主要流媒體正在擴大其對内容制作的投資,希望在新一波SVOD使用者競争中獲得優勢。其中包括HBO Max和Disney Plus等傳統巨頭,以及Apple TV Plus和Amazon Prime等科技巨頭。

例如,迪士尼正在将其核心戰略從付費電視轉向付費電視,宣布計劃關閉100個國際電視訊道,并将内容轉移到迪士尼Plus。

從2019年到2020年,亞馬遜在Prime上的電視節目,電影和音樂預算增加了40%以上。

但Netflix很清楚其在非英語市場的先發制人優勢,并預計海外使用者最終将成為其商業帝國(如谷歌)的核心支柱,選擇"在海外包圍美國大陸"。用Netflix的國際配音導演黛布拉·欽(Debra Chinn)的話來說,"這實際上是在創造一個新的觀衆群。

這條道路與未來的收入空間直接相關,是以配音尤為重要。在過去的幾年裡,他們一直在招募配音演員和制片人,試圖建立一條工程生産線。

一方面,它旨在提高國際節目英文版的品質,吸引可能厭倦了低品質畫外音的英語觀衆,并提高全球3.71億以英語為母語的人(其中大多數居住在美國)對非英語系列的整體收視率。

對于美國或英國的電視觀衆來說,畫外音内容是一個奇怪的概念,除非你看中國武俠電影。有趣的是,市場分析公司Statista發現,59%的美國成年人更喜歡看英語配音的外語電影,而不是帶字幕的原創電影。

在2019年的一次采訪中,Netflix透露,熱門節目的配音版本更受歡迎。例如,85%的美國觀衆選擇了《雨》的畫外音版本而不是字幕;78%的人選擇了德國驚悚片《黑暗》的配音版本,72%的人選擇了西班牙《金錢大劫案》的配音版本。

革字幕,鼎配音,AI這次玩大了

第一部丹麥劇集《雨》

革字幕,鼎配音,AI這次玩大了

西班牙電視劇《筆記之家》

另一方面,Netflix希望将其英語配音體驗擴充到更多語言配音。根據Ampere Analytics的資料,Netflix在大多數非英語地區播放的内容中有90%是外語内容,配音很重要而且很困難。

以歐洲為例。配音版本的節目在歐洲電視市場早已司空見慣,在那裡它們經常跨越國界 - 一個蓬勃發展的行業,有自己的頒獎典禮,配音演員本身也很有名。這使得當地消費者更容易接受畫外音。

特别是在法國、西班牙和德語國家,畫外音是進入市場的首要條件。在德國,配音也已成為一個大産業,頂級配音演員每部電影的收入在15,000美元到20,000美元之間。如果一家美國大型分銷公司想要打入德國市場,它必須有一個畫外音。

配音在意大利也是一個非常成熟的市場。今天,99%的意大利電影和電視節目都是配音的。

近年來,Netflix在配音方面的投資以年均25%至35%的速度增長,配音内容消費的增長速度超過投資,平均每年增長超過120%。随着《金師傅》預算的增加,一些大型本地化工作室的收入飙升。

ZOO Digital Digital是一家擁有Netflix,亞馬遜和Apple等大型流媒體客戶的媒體本地化提供商,最近報告了有史以來最好的季度業績。就細分市場而言,本地化對業務收入的貢獻率超過51%。對該公司基于雲的配音服務的需求飙升,配音收入增長了50%,達到900萬美元。

另一家全球本地化工作室BTI Studios在2010年僅獲得了其收入的3%,此後躍升至61%,而字幕收入不到40%。

ZOO Digital認為,流媒體熱潮對媒體本地化提供商來說是個好消息,因為字幕和畫外音在主要流媒體平台之間正在進行的觀衆争奪戰中發揮着關鍵作用。随着内容預算的增加,他們發現買家越來越希望與提供端到端服務的供應商合作。

BTI Studios最近與另一家本地化公司IYUNO Media Group合并,旨在通過啟用全球配音和字幕功能來解決"對本地化内容快速增長的需求",包括應用人工智能來應對傳遞周期的變化。

02 為阿喀琉斯之踵發聲

Netflix首席産品官格雷格·彼得斯(Greg Peters)将國際電影收視率的上升歸因于更好的配音。

什麼是好的畫外音?"作為配音演員,你能得到的最好的贊美是,沒有人意識到這是一個畫外音,"德國的迪特瑪·溫德(Dietmar Wunder)說,他在邦德系列中為丹尼爾·克雷格(Daniel Craig)配音。

"我們的工作是消失在原作的背後,這樣觀衆就不會去想它了。

然而,大多數配音離"無影無蹤"還很遠。斯科特·曼恩(Scott Mann)被羅伯特·德尼羅(Robert De Niro)主演的2015年驚悚片"劫案"的配音版本所震驚。

影片中的整個對白都經過了修改,使外語台詞更接近德尼羅的台詞。在拍攝期間,德尼羅花了數周時間讨論一個場景,詢問角色将穿什麼袖扣或襪子。然而,當電影配音時,他的表演受到了玷污。

"這令人心碎。我們糾結了幾個月的劇本,争論着該說哪句台詞以及如何說,然後看到了它的外語版本,台詞都被改了。一切都感覺很糟糕。

在目前的技術和操作模式下,令人心碎的斯科特·曼恩(Scott Mann)的結果幾乎是不可避免的。

在收到ADR(完整剪輯編輯後演員背配音台詞的技術處理)後,國際發行公司會将聲帶和最終語言聲帶發送到不同地區進行翻譯處理。

例如,在中國,配音導演首先觀看原版電影,并将台詞翻譯成中文文本。然後,口型官員進行了初步檢查,根據外文長度、口型等調整中文翻譯。随後,配音導演、配音演員和翻譯一起觀看原版電影,配置設定角色,并根據演員的配音習慣進行中文翻譯配對。

最好的配音經常改變語言,以找到與演員嘴巴動作最接近的同步。例如,Hello說"你好"。但是,"llo"的英文發音可以拖拽聲音,為了保持口的一緻性,"好"也拖拽了語氣,是以就出現了"你好"的所謂"讀腔"。

盡管後期工作很多,但演員的表演和畫外音之間存在不比對。許多中國觀衆也無法體會到這種"閱讀腔"。

視訊遊戲也是如此。很多時候,遊戲發行商隻會在英語作品中同步角色的嘴巴,并在本地化其他語言時進行額外的配音。如果将對話從英語翻譯成法語,則翻譯後的版本可能比原始句子長得多,通常通過延長動畫以填充額外的音頻時間來處理。

除了技術手段,是否劃算也是制約畫外音品質的重要成本因素。

動畫師大約需要7個小時才能完成一個動畫,其中一個角色在遊戲中說話1分鐘。《Seb Punk 2077》是一款對話量很大的RPG,如果支援10種不同語言的口型同步,遊戲公司将不得不付出巨大的勞動和時間成本。

在美國,一部兩小時的電影,一種語言的成本可能超過15萬美元,大片通常被翻譯成12種語言,電視劇通常用六到八種語言配音。所需的時間和金錢不具有成本效益。

以《行業良知》和《功夫熊貓3》的翻譯為例。據說,中文畫外音花了八個月的時間,夢工廠還成立了專門的中文創作團隊,有中國編劇、導演等,他們都寫了一篇中文說話方式接地氣的空中對話。中文版根據中文線條重新塑造和表情符号每個字元。

如此費時費力的操作,在很多進口大片中實作了基本的準同步(有時甚至是提前上映)的趨勢,隻能停留在案例層面。

随着後期翻譯時間越來越緊張,很多時候,一部進口漫畫在中國的畫外音時間隻有3-5天。據說,一顆交通之星為龍王3隻花了一天時間。粗暴的沖刺,隻能完美破壞一部美麗電影的原有内涵。

Netflix 每集 10 集,每集 60 分鐘,通常需要 16 周的時間來配音。再富的氛圍,公司也有戰略重點。

在日本市場,幾乎每部劇都有日語字幕,超過40%是配音的。宮崎駿和吉蔔力工作室的精彩作品增加了28個字幕和20個畫外音。

除日本外,其他四大配音市場位于歐盟——法國、德國、意大利和西班牙——其中60%的外國内容被配音。對于 Netflix 而言,法語、德語、意大利語和西班牙語等語言的配音内容可以繼續投放到拉丁美洲、非洲和加拿大等其他市場。

但是,俄羅斯和土耳其等國隻占Netflix使用者群的一小部分,而愛沙尼亞的人口隻有一百萬,是以很難證明他們的大規模本地化投資是合理的。

最有趣的是印度市場。該公司首席執行官裡德·黑斯廷斯(Reed Hastings)預測,Netflix的下一個1億使用者将來自印度。然而,印度講450種語言,其中23種被認為是官方語言。随着Netflix的訂閱資料在印度增長如此之快,配音翻譯的困難遲早必須克服。

03 深度視訊人像 深面部變化

在低效和密集的勞動力聚集的地方,就有可能發生新的技術革命。

新的皇冠流行進一步加速了這一程序。Netflix不得不在2020年推遲一些節目的本地語言版本,工作室關閉,配音演員被淘汰。

人工智能可以幫助彌合這些差距,即使工作室最終決定依靠真正的配音演員來制作最終版本。嗅覺初創企業進入深度學習技術。

和迪士尼一樣,斯科特·曼恩(Scott Mann)也在關注Deepfake的臉部變化。Deepfake的基本假設之一是,如果您有足夠的角度2D照片,您實際上可以建立一個完整的,連續的3D模型。

您可以使用大量線上被盜的2D圖像訓練恒星模型,以教AI建立有關恒星的3D面孔,通過疊加它們來替換目标視訊中角色的面孔。

但是,在短短幾秒鐘内,大多數觀衆會注意到該視訊是假的。因為訓練資料是靜止圖像,是以當你把名人的臉放在演員的臉上時,很容易看到眉毛不比對,動作不穩定和其他洩漏。

2018年,馬克斯普朗克資訊學研究所的Christian Theobalt團隊在SIGGRAPH上展示了Deep Vedio Portrait(DVP),重制了近乎逼真的人類視覺效果。

該系統使用一系列面部重建,以便它可以跟蹤和捕獲敏感區域(如眉毛,鼻子,嘴巴等)的細微動作,進而可以将細微的細節創造性地"轉移"給目标演員,使他的面部動作看起來與新發音的表情一樣準确和同步。研究人員使用面部表示方法來計算兩個視訊的面部參數。

為了更逼真,他們還稍微修改了這些參數以呈現它們。這也是建構對抗網絡(GAN)可以使用的地方。一個神經網絡生成内容,而另一個神經網絡拒絕或準許每項工作。目标是建立與目标視訊幀中的圖像一樣好的假圖像,以欺騙辨別符網絡。

隻需大約兩千幀 - 相當于一分鐘的鏡頭 - 就足以訓練網絡。

與使用2D圖像進行學習的Deepfake不同,DVP由現實生活中的演員訓練3D面部動作。DVP不是面部變化,而是面部特征治療,就像AI操縱的面部肌肉木偶戲一樣。

DARPA官員馬修·圖雷克(Matthew Turek)告訴外國媒體,在目前GAN作品中檢測出微妙變化線索的方法似乎對DVP作品并不十分有效。因為,它似乎完美地比對了源演員和目标演員之間的整個面部和頭部運動。

除了能夠經得起大銀幕挑剔的逼真效果之外,讓過度勞累的視覺藝術家和預算有限的好萊塢制片人印象深刻的是成本效益。它快速而便宜,特别是與完全重制的成本相比。

數字變臉是影視圈的常事,特效鏡頭花了很多年時間。在"本傑明·巴頓的古怪"中,布拉德·皮特的臉在電影的幾乎每一幀中都被修改過的計算機圖形版本所取代。

革字幕,鼎配音,AI這次玩大了

人臉計算機圖形編輯已在當今的劇情片中得到廣泛應用。一個很好的例子是本傑明·巴頓的古怪。

然而,傳統的特效鏡頭需要大量的後期制作,并且需要花費大量資金,即使是幾秒鐘的鏡頭,人力和材料輸入,以及通常由訓練有素的藝術家進行的數周工作。

例如,特技替身會短暫地看着鏡頭,即使是短暫的片刻,也需要大量的後期制作,以確定螢幕上的人看起來就像他們應該的那樣。

解決這些問題通常需要重新拍攝,或者将聰明的計算機映射和合成結合起來,這從來都不便宜。DVP展示了将來如何更容易地建立這種視覺效果。人們可以輕松編輯演員的頭部位置和面部表情,以改變錄影機角度或巧妙地改變場景構圖。

研究人員說,人工智能不僅可以産生高度逼真的結果,而且比今天使用的手動過程要快得多。

盡管該技術仍處于概念驗證階段,但Scott Mann在發現研究白皮書後決定建立Flawless,因為它對視覺娛樂行業的潛在破壞性影響。

作為一家吹捧下一代電影制作的科學和創新的AI公司,該公司的産品介紹确實寫得很好。網站上第一個(也是唯一一個)人工智能産品現在被稱為TrueSync,聲稱是世界上第一個使用人工智能以多種語言建立完美口型同步可視化的系統。

TrueSync有一個所謂的性能保留引擎,一個演員頭部的3D模型。原作涉及演員獨特表演風格的細節,如皺眉和低垂的表演造型,這些都可以被AI學習和捕捉,并完好無損地儲存下來。雖然演員的臉被替換了,但他們原來的細微差别将被保留下來,并延伸到目标臉部,以保持原版電影的質感和沉浸感。

革字幕,鼎配音,AI這次玩大了

該技術會自動生成與畫外音對話相對應的嘴唇運動。傑克·尼科爾森在《一海的風》中與湯姆·克魯斯的聊天幾乎與法國畫外音完全同步。

如果客戶需要斯嘉麗說中文,他們需要像傳統畫外音一樣,将中文錄制為演員,并将音頻和圖檔發送給Flatless。基于這些資訊,并基于現有的斯嘉麗模型,該公司的系統計算出斯嘉麗說中文時獨特的嘴巴動作,進而建立了一個斯嘉麗說中文的面部模型。最後,您需要該公司的數字效果藝術團隊對其進行潤色。

在Flawless看來,對于想要保留原班人馬魅力的導演來說,這項技術将是一種更經濟的方式。

在2020年奧斯卡提名丹麥電影《德魯克》(也譯作《醉酒的酒精計劃》)大獲成功後,萊昂納多·迪卡普裡奧(Leonardo DiCaprio)将為英語觀衆翻拍。這意味着6000萬美元的翻拍成本。

如果男咖喱大師在英國觀衆中不夠強大,可以找一個大牌翻拍(比如好萊塢翻拍的《無限之路》)。但主人公馬克斯·米克爾森(Max Mickelson)并不是英語世界中的低級人物,電影中表達的丹麥飲酒文化對美國觀衆來說并不陌生。借助完美無瑕的技術,在保留原版電影的同時,可以以更低的成本(例如,翻拍成本的2%)吸引更多的英國觀衆。

04 聲音藝術

Flawless的技術并不像它的名字所暗示的那樣完美無瑕,100%完美無瑕,但它相當不錯。像迪士尼這樣的公司也在努力提高Deepfake技術的品質,以便它能夠快速滿足好萊塢的需求。

雖然深度改變面孔的技術尚未産生商業上的成功故事,但語音AI已被證明在遊戲視訊方面取得了商業成功。

在發行的第一個月,備受期待的科幻RPG的Seb Punk 2077在全球售出了超過1370萬份。據說,預購玩家數量最多的國家是中國。這與中文本地化無關。當你玩這個遊戲時,你會發現說國語的角色真的很像說國語。

響應10種語言的畫外音也被視為營銷的重要組成部分。根據遊戲制作人CD Projekt Red的說法,遊戲中最直覺的感覺是畫外音。通過為玩家提供本地化體驗,擴充到新的零售市場。

革字幕,鼎配音,AI這次玩大了

遊戲的技術支援提供商 Jali Research 會檢測形成每個單詞的單個聲音,并相應地對角色的臉部進行動畫處理。

正如 Scott Mann 受到 Top Papers 的啟發,開始創作 Flawless 一樣,CD Projekt Red 也在 SIGGRAPH 上找到了技術廚思。

該遊戲的本地化技術支援來自加拿大初創公司Jali Research。他們開發了一種工具,該工具使用AI将音素準确地映射到目标角色的嘴形,令人信服地使角色用不同的語言說話。這項技術可以追溯到公司首席技術官Pif Edwards博士的一項研究。

在攻讀計算機科學博士學位之初,愛德華茲希望專注于面部動畫,但最終專注于語音,因為"結果表明,當人們表達自己時,他們幾乎總是在說話。

由于對當時可用于處理語音和動畫的工具不滿意,他決定建構自己的工具。2016年,Pif Edwards向SIGGRAPH送出了一篇關于表達嘴巴同步模型的論文 - JALI,由奧斯卡獲獎動畫師和導演共同撰寫。

利用心理語言學發現,他們試圖找出數百個影響面部動作的變量,并建立了一個網絡(VisemeNet)來預測目标發音中的口腔狀态。該論文稱,所謂的"下颚和嘴唇整合",即"下巴"和"嘴唇"的組合,解釋了視覺語言的大部分變化。

在Seb Punk 2077配音的情況下,他們将機器學習與基于規則的AI相結合。

第一階段側重于機器學習。假設有人說"Hello"音頻檔案,"H"在哪裡開始和停止?"e"、"l"和"o"的聲音在哪裡?他們将音素資訊标記為特定語言,然後使用資料來訓練機器識别某人說話時實際發出的聲音。

系統向機器提供您從未見過的對話,預測聲音之間的界限和每個音素的長度。

第二階段主要是動畫,使用傳統的基于規則的AI。這是一個更簡單的"如果,那麼"系統,它隻是根據特定的輸入執行所講述的内容,并可用于确定根據發出的聲音生成的嘴形。

與大多數人的直覺相反,嘴巴并不直接對應于特定字母的形狀或發音。例如,"en"的發音通常取決于它周圍的字母,而不是音素的語音形狀的發音。如果後面有一個"e",則最後一個"n"或"no"可能會被發音。

所謂規則是指中國人的言語,用同樣的聲音做出面部表情來遵循一些規則。這意味着您需要為不同的語言模組化您的語言,但您不必為不同的語言建立不同的動畫模型,并且所有語言的動畫元件都是相同的,進而節省了大量的時間和金錢。

事實上,除了逼真的效果之外,與更昂貴的傳統方法(如關鍵幀和動作捕捉動畫)相比,工作室還可以以相對較低的成本擴充面部動畫。

革字幕,鼎配音,AI這次玩大了

Jali Research的本地化不僅僅是關于同行,甚至考慮面部表情也很有吸引力。

同樣激進化演講藝術的是Deepdub,這是一家由YC在矽谷孵化的以色列公司。如果說完美無瑕的技術暫時留住了配音演員,那麼Deepdub隻是利用演員的音響效果來演奏當地語言,盡管他從未說過這些台詞。

據報道,在内部分享的一段視訊中,摩根·弗裡曼(Morgan Freeman)表示,英語視訊可以切換到畫外音模式,弗裡曼自己說西班牙語 - 不是通過配音演員,而是用他自己嘶啞的聲音。

開發這個系統需要不同技術的組合,包括深度學習、信号處理、獨特的演員語音模組化、神經風格遷移和NLP。深度學習學習音軌材料中聲音的特征,包括音高、音高、速度、間隔和語調,它被記錄下來并用于新的行中。

該公司還試圖比對嘴唇同步或嘴唇運動,以進一步增強視聽效果。

創始人是兩位電影愛好者,他們希望客戶隻需按一下選擇按鈕即可輕松本地化多語言内容,将一切都留給AI。

盡管該公司尚未通過公開産品證明自己,但其活動背後的潛力是顯而易見的。最近,Deepdub還成功邀請了前HBO Max首席内容官Kevin Reilly加入該公司的顧問委員會,以幫助将其AI配音技術帶到好萊塢。

如果Deepdub的AI大規模部署,它将颠覆工作室,内容創作者和制作人的傳統遊戲規則。根據Kevin Reilly的說法,這幾乎是不可避免的。他甚至預測自己不會再回到電視台的高管崗位上。

例如,這可能導緻配音行業的失業,而傳統的ADR可能不需要,因為合成聲音可以取代演員,後期制作不必回到錄音室重新錄制某些台詞。

現在,一部電視劇可能需要14到16周的時間來配音,而Deepdub的技術需要四到六周的時間,并且計劃以比手動配音低得多的成本進一步壓縮到不到兩周。

這些新興技術還通過顯著加快配音周期和縮短本地版本和其他版本之間的視窗期,有效地防止盜版。這在遊戲市場上已經得到證明。随着CD Projekt Red更加注重翻譯和本地化,越來越多的波蘭玩家願意為正版遊戲付費。

目前,這些人工智能公司必須與好萊塢大公司合作,将技術貨币化。

每個看過這個節目的人都會說,"哇,我會說法語。Flalles在AI畫外音後向演員展示表演時驚呆了。Flawless與工作室保持聯系,并與最大的流媒體平台之一合作。

Deepdub開始變得嚴肅起來。他們達成協定,使用他們的AI語音合成技術将拉丁美洲西班牙語和巴西葡萄牙語添加到電影"每次我死"中,該電影目前在英國的Netflix上向美國觀衆提供。

革字幕,鼎配音,AI這次玩大了

05 特效和僞造

當萊昂納多·迪卡普裡奧和他的女朋友站在船頭時,鏡頭向後拉了兩三英裡,無縫銜接。

電影業使用特效,但沒有人意識到類似的技術本質上是僞造的。

幾十年來,技術的魔力(超越了前幾部電影的效果)似乎是最高目标。這種對現實的操縱導緻了一種新的現實,超現實。無論是計算機合成、數字圖像處理、3D動畫模拟,還是人工智能,電影制作人對超現實的追求已經達到了不可逆轉的水準。

現在我們可以很容易地建立一個非常逼真的面孔。下一個問題是,我們應該如何處理這些生成的人臉?面部護理在電影行業可能會引起争議。當一些演員看到他們的表演發生變化時,他們會有什麼反應?如何使這項技術合法和道德?你如何看待一個正在消失的現實?

可以肯定的是,無論是像Redditor,Adobe這樣的匿名大玩家,還是學術界本身,所有管道都在先進的音頻和視訊處理方面取得進展,沒有人緻力于踩刹車。研究界非常擅長開放和廣泛共享的技術,權力的快速民主化幾乎是不可避免的。AI效果隻會變得更好,更便宜,更快。

電影導演和制片人也對這些技術表現出越來越大的興趣。這類似于2000年代使用逼真的計算機圖形的情況。多虧了AI,"突然之間,每個人都想做點什麼。

我們正處于一個任何人都可以制作可信視訊的時代,任何人都可以聲稱視訊是假的。社會不可避免地必須适應這種變化,盡管這可能是痛苦的。

繼續閱讀