能讓馬斯克“Wow”的東西絕對不簡單!
就在昨天,馬斯克在萊克斯·弗瑞德曼(LexFridman)X評論區表達了“Wow”的驚訝。
馬斯克大家都熟悉,而和他互動的這位,其身份也是相當的了不起。
萊克斯·弗瑞德曼(LexFridman)是一位知名的播客主播,同時也是麻省理工學院的研究科學家,專攻人工智能方向。許多人認識他大都是通過《LexFridman播客》這檔節目。
在節目中,他曾采訪過“科技狂人”馬斯克、“ChatGPT之父”山姆·奧特曼、美國UFO事件親曆者DavidFravor等衆多知名人物,訪談話題涉及科研、學術、懸疑、社會等諸多領域,每期視訊的資訊量都非常高,深受人們喜愛。
除了訪談做得好,人家在科研方面也一點都不含糊。在MIT,他開設了包括深度學習、自動駕駛、強化學習等方面的諸多課程;在自動駕駛領域,他也設計了防止司機分神的圖像識别檢測功能。此外,他還是巴西柔術黑帶選手,健身愛好者,彈得一手好的吉他和鋼琴,可謂是點滿了所有天賦點。
不過,這位天才級的人物也是馬斯克的迷弟,在X上和馬斯克“眉來眼去”已經不是一天兩天了。
那麼,到底這次是什麼内容,能讓兩位科技圈大佬都如此關注呢?
答案就是,Spotify即将推出的“播客的語音翻譯功能”。
01
“克隆主播聲音”的語音翻譯
Spotify是目前全球最大的正版流媒體音樂服務平台之一,其付費使用者超過2億,市值高達240億美元,每月有近5億的活躍使用者,是音樂和播客行業的上司者。
近幾年,Spotify格外重視播客業務,收購了十餘家播客業務的相關公司,涵蓋了内容制作、創作工具、廣告測定服務、變現及資料分析等衆多方面。
除此之外,在2020年,Spotify更是以1億美元的價格購買了JoeRogan播客節目《TheJoeRoganExperience》的獨家播出權。在播客業務上,Spotify可謂是下了血本。
而這一次的語音翻譯功能,将會在Spotify播客業務全球化的道路上,為其注入強大的動力。
語音翻譯功能的特殊在哪?那就是克隆聲音的特質,進而讓一個播主能夠“原聲”無縫切換到各種語言。
結合實際,以往我們要是想看懂國外的一些短視訊、電影、電視劇或者廣播内容,要麼是通過字幕,要麼就是通過配音,或是二者的結合。
在專業字幕組缺位的情況下,身懷絕技的熱心網友會化身“字幕組”,親自翻譯視訊中的對話,并添加字幕。這讓我們即使聽不懂,但也能看懂這些國外内容。
但一邊看字幕,一邊看視訊着實也有點累,于是配音便上線了。但配音也帶來了一些有趣的現象——聲音和人對不上号。比如周星馳的電影太過熱門,大家都理所當然地把配音的聲音當作周星馳的聲音,而當真的聽到周星馳的聲音,或“周星馳的聲音”出現在其他電影人物身上時,會感覺有點奇怪。
當Spotify推出新的“語音翻譯功能”(Voice Translation),這一切将發生改變。人物能夠自動切換到各種語言,而且是“完全原聲”,連說話節奏,語氣都能還原。
Spotify稱,他們這個AI語音翻譯功能,由OpenAI的自動語音識别模型Whisper提供技術支援,能夠在翻譯時模仿原始演講者的風格,并且比傳統配音更加自然。使用這個功能或許能讓播客擴大閱聽人群體面,使用者也将獲得無縫切換語言的聽力體驗。
目前,這款功能還處在測試階段,隻提供西班牙語翻譯版本,法語和德語将在接下來的幾天和幾周内推出。
盡管如此,但新功能的首測——《Spotify的AI語音翻譯試驗,讓你喜歡的播主用你的母語為你播報》,還是吸引了許多著名的播客主持人,其中就包括戴克斯・夏普德、莫妮卡・帕德曼、萊克斯・弗裡德曼、比爾・西蒙斯和史蒂文・巴特利特。
Spotify的個性化副總裁ZiadSultan說道:“通過比對創作者自己的聲音,語音翻譯為全球的聽衆提供了前所未有的更真實的方式。”這種利用音頻力量來克服邊界、距離等擷取障礙的技術的使用,彌合了語言差異,并且使得内容具有更強的影響力和傳播力,超越一般文字翻譯帶來的社會效益。
02
AI帶來
自媒體的“真·全球化”時代
語音翻譯功能的出現在國内也受到了關注,如此強大的功能令許多網友都開始期待中文版,有網友稱“AI将帶來自媒體的全球化時代”。
事實上,這一觀點還真值得留意。語言是内容傳遞的重要載體,内容要想實作跨區域或者說全球化的傳播,那麼語言的轉化是必要的環節,但這一轉化同樣是需要成本的。
一個媒體軟體多大程度上能被一個國家或者地區接受,除了内容因素外,也受到其内容的語言轉化能力的影響。如果其所能支撐内容轉化能力的資源較少,那麼在需求的滿足上,也會下降,這在一定程度上削弱了自媒體軟體或者媒體平台在該地區的影響力,阻滞其進入地區市場的速度。
而“語音翻譯”功能的出現,在保證原聲的基礎上,也提升了轉化能力和降低了轉化成本,有利于内容傳播範圍和速度的提高,進而帶動軟體在全球範圍内的流動。
但在目前,Spotify還處在一個比較有限的應用範圍,這離不開對其安全性的考慮。
如果說以往的媒介問題是源于傳遞資訊時的損耗和失真,那麼當下的媒介問題,則是由于媒介呈現的資訊“太過真實”。
例如前不久的“AI孫燕姿”翻唱了大量的知名曲目,引發全網轟動,其效仿者也是趨之若鹜。但如此多“以假亂真”的作品的出現,也給分辨何者是真實何者是合成的造成了困難。加之這樣的一種“真實”或“還原”是基于大量資料的擷取、積累以及整合分析。但資料本身就存在公私邊界模糊的難題,使用的灰色地帶依舊十分顯著。
此外,該功能以何種形式與平台結合,并以何種形式為使用者服務,這些都需要系統的規劃。但可以肯定的是,AI正在簡化内容傳播的流程,提升傳播的效率,媒體的全球化正在不斷加快。
作者:西瓜 排版:黃蕾卉
圖檔源于Q仔網際網路沖浪所得,若有侵權,背景聯系,Q仔滑跪删除~