Metor生成式A/語音：Voicebox驚豔問世。·Controlor在元宇宙上摔了大跟頭。2022年經曆大規模裁員，

作者：白蓮如風 2023-06-27 10:25:00

Metor生成式A/語音：Voicebox驚豔問世。

·Controlor在元宇宙上摔了大跟頭。2022年經曆大規模裁員，但小紮絲毫沒有自暴自棄，而是一鼓作氣研發出了生成式Al語音系統voice box。語音的核心問題是什麼？需要大量的專業資料來對特定的AI語音進行訓練，耗時長、成本高而且能力單一。

voicebox是一種基于流比對的方法，能夠學習到語音和文本之間的非确定的映射關系，減少了繁瑣的語音标注環節。mentor訓練voicebox采用了六個國家的語言，英語、法語、德語、西班牙語、波蘭語、葡萄牙語，包含了5000個小時的錄音、轉錄文本以及公共領域的有聲書。

·Voicebox不僅能夠合成這6種語言，還能夠進行噪聲消除内容編輯、轉換音頻風格。因為擔心這種技術被濫用，現在Mentor并不打算公開語音的AI模型。

接下來看看生成式的語音系統到底厲害在哪裡？

·第一點，特定語境的文本轉語音。Y box僅需2秒左右的音頻樣本輸入就能将文字生成和樣本風格一緻的語音内容。這個技術的應用價值非常大，比如可以定制你喜歡的虛拟助手，可以讓有視聽障礙的人士像正常人一樣溝通和對話。

·第二點，跨語言風格遷移。給定一段語音樣本和對應的文本片段，不管是英語、法語、德語，還是西班牙語、波蘭語、葡萄牙語。voice box能以任何一種語言讀出文本，這不就是随身攜帶了一個翻譯機嗎？不同國家之間再也沒有語言障礙。普通人可以通過自己的語調，語氣來說外語，對于喜歡旅遊跨國工作的人真是太實用了。

·第三點，語音的降噪和編輯，噪音污染是語音系統的棘手問題。voicebox擁有上下文的學習能力，是以當音頻中出現被噪聲污染的片段可以通過voicebox進行自動裁剪并與整體的音頻無縫銜接。這項能力對于内容創造者真是太友好了。

拿我自己來講，我也經常編輯短視訊，但是在錄音的過程中難免會出錯，一旦等到視訊編輯完了再發現這個錯誤那已經太晚了，還得重新錄一遍。Voicebox可以自動化的解決這個問題。

·第四點多樣化的語音采樣。voicebox通過學習海量、多樣化的語音資料可以合成超級自然的人聲，未來不管是遊戲中的NCP還是數字人、影視配音，AI的表現會越來越接近真人。此外這種能力還可以合成資料幫助訓練語音助理，值得欣喜的是它的表現和使用真人語音資料訓練的模型差不多。這種方式可以極大降低語音應用的開發成本提升效率。

技術總是會有兩面性的，mentor為了降低這個技術被惡意使用，它建構了一種分類器能夠識别真人的聲音和voicebox創造出來的聲音。

好了今天先到這裡了，面對強大的Voicebox你心動了嗎？過去AI的核心價值是降本增效增收，未來價值體系變成如何讓"人人平等"。論文位址：speech-generation-at-scale/更多價值資訊關注公衆号：夏葉華。視訊号：Eva産品戰略。

Metor生成式A/語音：Voicebox驚豔問世。·Controlor在元宇宙上摔了大跟頭。2022年經曆大規模裁員，

Metor生成式A/語音：Voicebox驚豔問世。·Controlor在元宇宙上摔了大跟頭。2022年經曆大規模裁員，

繼續閱讀

李宏毅2020ML——P83 Transfer Learningintroduceideas

HJT降本增效終局技術？電鍍銅産業化漸進裝置商迎機遇

Example-Based Style Transfer with Guidance 總結Example-Based Style Transfer with Guidance

神經風格遷移（Neural Style Transfer）簡介

學習能力的3個階段，大部分人都停留在第一階段

Spring MVC源碼解析：基于Servlet手寫一個Spirng MVC

直到中考後才發現國小踩了很多坑，看完之後，真是被驚豔到了，原來英語入門要早、一定要堅持一項體育活動、每天睡覺前要給孩子閱

馬雲沒有說謊，中國三大癌症“如期而至”。有三個工作打死也不要做。馬雲說漏嘴了：比沒錢更可怕的危機已經到來。未來，中國的肝

企業的數字化管理存在四大核心問題：·第一，許多企業缺乏資料積累和沉澱的習慣。·第二，資料品質低，價值不高。·第三，資料不

雲原生大資料峰會來襲，破解上雲降本增效密碼

軟體工程的核心問題并非是程式設計

為了刺激内需，國務院多次發文卻始終未找準群眾不消費的核心問題。疫情結束後，“消費降級”成為人們常聽到的一個詞。此次國務院

發展了10多年go語言看似很火，卻一直沒有排進前10，最近熱度又突然間就降溫了，不知道會不會走上PHP老路。說到底還是J

圖像風格遷移TensorFlow+Keras

進階教練熊志超送的親筆簽名《讓銜接技術理論開啟乒乓球運動員的戰術思維》收到啦！[贊][贊][贊]感謝熊教練對我在乒乓領域

基層的員工如何脫穎而出，被上司層識别出來是高潛力的員工？很多基層崗位上的員工認為，幹大項目、做有大貢獻的事情才能被上司看