天天看點

AI讓趙本山、郭德綱一起飙英文:背後科技來自中國團隊,7個月收入百萬美元

AI讓趙本山、郭德綱一起飙英文:背後科技來自中國團隊,7個月收入百萬美元

你能想象趙本山一口純正倫敦腔嗎?

在AI時代,一切皆有可能。

近日,不少郭德綱說英文相聲、趙本山倫敦腔接受采訪、馬保國狂飙日語化身馬大佐的視訊開始在網際網路風靡,這背後的核心技術來自于一款AI視訊工具。

據悉,這一技術支援300多種聲音、40多種語言,不僅可以準确卡點,音色與講母語時候的音色類似,甚至連口型都能對上。

在來勢洶洶的AI浪潮下,這次“被失業”的又是誰?

賽博法師讓趙本山、郭德綱說英文,AI取代人類程序加速?

從上周開始,郭德綱說英文的視訊就開始在抖音、微網誌等平台瘋傳,在這些視訊中郭老師不僅用英文接受采訪,還用英文說相聲。而這些的視訊并非簡單的配音或者AI變聲,而是高度貼合人物聲線和風格、甚至連嘴型都比對,以假亂真程度讓圍觀者大為震驚。

AI讓趙本山、郭德綱一起飙英文:背後科技來自中國團隊,7個月收入百萬美元

本周一趙本山倫敦腔接受采訪的視訊以同樣的原因在全網爆紅。在這兩例娛樂性極強的案例的啟發下,有網友認為在未來翻譯的工作極有可能被AI取代,而好萊塢罷工所擔憂的AI取代演員危機似乎也初見端倪。

藍鲸記者采訪到了其中多條爆款視訊的制作者UP主賽博法師,他告訴藍鲸記者,這些視訊的爆火在他的預期之中,“在發作品之前,還在制作過程中的時候我就知道會火。”他表示,自己本身是傳媒、新媒體行業出身,進行AI相關内容創作也有半年多,認為自己的網感和對AI發展的情況都有一定自信,“在作品還在制作中的時候,我都在不禁感歎,實在是太像了。我們這些AI相關的創作者更了解現在的AI發展到哪一步了, 門檻值比普通人更高,連我都感歎的東西,普通人看到也一定會贊歎。”

除了技術本身帶給大家的震撼,這類爆款視訊的主人公也是精心選擇的結果,賽博法師表示,“主要是反差感。趙本山和郭德綱都是老派語言類表演藝術家,他們在公衆前的形象都是比較有鄉土氣息的,并不那麼洋氣,那麼設想一下,當觀衆們看着他們兩個突然飚出一口英文會怎麼樣?我就是想抓住這個反差感,讓他們第一時間吸引觀衆的耳朵和眼睛。”

不過從AI孫燕姿起,版權就像一把達摩克利斯之劍懸在創作者頭上,賽博法師也不免有此擔憂,他告訴藍鲸記者,自己雖然同步在B站與抖音都釋出了相關視訊,但趙本山和郭德綱并沒有在抖音火起來,很大程度上是因為被限流了,“還是比較擔心版權問題的,目前這還隻是翻譯了原視訊,我要是直接修改人物發言内容,造成名譽受損、造謠等後果那就太嚴重了。”

AI郭德綱技術來自深圳創業公司,已實作盈利

據賽博法師介紹,AI郭德綱的實作主要基于一款AI視訊工具HeyGen,使用者隻需上傳視訊,選擇語言,就能生成自動翻譯、音色調整、嘴型比對的視訊。

而HeyGen背後則是一家在深圳創立的AIGC企業。

HeyGen的開發團隊為詩雲科技,司如其名,公司名中的“詩雲”取自劉慈欣科幻小說《詩雲》,寓意人的創造性無法被科技取代,但創作的過程和效率卻可以被機器極大優化,而現實中詩雲科技要做的也是用AI生成内容,讓使用者以更低成本完成内容創作。

據天眼查APP,詩雲科技的法定代表人為徐卓,目前公司已完成兩輪數百萬美元融資。其中2021年3月,詩雲科技宣布獲得紅杉中國種子基金和真格基金的天使輪投資;同年8月30日,詩雲科技宣布獲得數百萬美元Pre-A輪融資,由IDG資本領投、紅杉中國種子基金和真格基金跟投。

徐卓英文名Joshua,他大學畢業于同濟大學自動化專業,後前往卡内基梅隆大學攻讀計算機碩士學位。作為明星應用Snapchat前100号員工 ,徐卓從0到1搭建了Snapchat廣告平台、推薦算法系統以及機器學習平台Barista,并負責AI camera的技術及産品研發,經驗十分豐富。他的創業合夥人梁望此前在位元組跳動擔任北美設計主管,二人同屬大廠精英。

AI讓趙本山、郭德綱一起飙英文:背後科技來自中國團隊,7個月收入百萬美元

HeyGen于2022年7月正式推出,據36氪報道,HeyGen在7個月内實作了100萬美元的ARR(年度經常性收入)。

HeyGen的收入主要來自于付費,據賽博法師介紹,這款應用分年付和月付,月付最低29美元包含15分鐘生成時間,再往上還有幾個檔次,主要是包含的生成時間不同。對于這樣的收費,賽博法師認為對于普通使用者而言并不便宜,“29美元/月的起步價對于美國人來說可能不算什麼,對于國内來說就太貴了,畢竟換算下來兩百塊出頭了。”

但同時他也肯定了HeyGen的技術:“半年前的AI技術,還需要20-30分鐘的人聲素材,才能訓練出一個聲音模型,而HeyGen隻需要幾十秒,而且目前沒見到同類産品能做到像HeyGen一樣對口型。”

從AI孫燕姿到AI郭德綱,AIGC是玩具還是工具

自從ChatGPT在國内掀起AI浪潮後,大廠悉數投入戰鬥,但現實來看,當初對标ChatGPT的大模型類應用或尚未面世,或并未掀起太大水花,相反一系列具體的落地應用反而成為了一個個小爆款。

2023年5月AI孫燕姿全網爆紅,背後的黑科技為“SO-VITS-SVC”。

“SO-VITS-SVC”源于2021年6月11日釋出的“VITS”的開源項目。“VITS”是一種語音合成模型,可以實作“文生音”的效果。但“VITS”模型需要海量的訓練資料,并高度依賴于人們對語料資料的文本标記,應用門檻很高。2022年8月26日,一位名為“Rcell”的B站使用者在“VITS”的基礎上,結合了Soft-vc、VIsinger等,開發出了“SO-VITS-SVC”模型。“SO-VITS-SVC”可以了解是一個音色轉換的AI模型,僅需十幾分鐘的音頻資料,便可以拟合成具備特定主體音色的工具。

2023年8月,國内首個AIGC爆款應用妙鴨相機引爆網絡,這是一款以AI大模型為基座的App,是由阿裡大文娛投資的一個創業項目。該産品公布後,一些高峰期排隊、個人隐私相關話題引發關注。

2023年10月,憑借AI郭德綱與趙本山,HeyGen走入大衆視野。

縱觀在國内激起大衆輿論層面關注的幾款AIGC應用可以發現,“玩具屬性”似乎是走紅的基礎,當初對标“第四次工業革命”的AI創業浪潮則并沒有在大衆層面給生産力環節帶來相應的驚喜。AIGC究竟會在多大程度上真正影響我們的生活?

對此,賽博法師認為,一個技術從出現,到被大家熟知,需要一個過程。以“玩具”的形式出現在大衆眼前,不一定是一件壞事,同一種技術,既可以做成玩具,也可以做成工具。“比方說我之前做過攝影師,在我手裡我覺得單反相機更好用,手機隻是圖一樂,拍不出相機的效果。但在普通人手裡,相機還真沒有手機好用,使用門檻的高低直接決定了适用人群,玩具也可,工具也可以,主要是看誰來用。”

繼續閱讀