天天看點

景聯文科技:深度了解語音識别之發音詞典及語音資料采集标注

“随着語音助手在生活中的不斷普及,其中配備的發音詞典的準确性受到越來越多企業的重視。景聯文科技采集标注大量高品質語音資料集,可全友善滿足發音詞典的采标需求,為語音采集标注提供資料支援。”

語音助手是一種智能型的應用,通過智能對話與即時問答的智能互動,可以幫助使用者解決問題,生活中常見的語音助手有“Siri”、“小度”等。這些語音助手中配備了相應的發音詞典庫,庫中包含了它們能識别出的所有語音。

景聯文科技:深度了解語音識别之發音詞典及語音資料采集标注

什麼是發音詞典?

發音詞典是儲存所有單詞的發音的詞典,并标明了其發音。通過發音字典得到聲學模型的模組化單元和語言模型模組化單元間的映射關系,把聲學模型和語言模型連接配接起來。形成一個搜尋的狀态空間,可以将其用于解碼器進行解碼工作。

一個句子可以用若幹個單詞組合起來,每個單詞都可以在發音詞典中查詢到該單詞發音的音素序列。相鄰單詞的轉移機率可以通過語言模型來擷取,音素的機率模型主要通過聲學模型擷取,進而組成一句話的一個機率模型。

在語音識别系統中,發音詞典涵蓋的資料量越大,對于提升語音識别的準确率就越高。當遇到新詞彙時,我們可以把這些詞彙和它對應音标添加進發音詞典當中,進而不斷增加詞典中的詞彙數量。可以說,衡量發音詞典品質的三大點主要為詞彙量、音标标注和校對的準确性。

景聯文科技:深度了解語音識别之發音詞典及語音資料采集标注

資料處理的重要性

目前,由于發音詞典的搜集、标注、清洗都需要經過專業的把控,如果沒有大量準确率高且涵蓋詞彙量較廣的發音詞典,就會影響到語音識别系統的性能。

資料經過清洗、标注等一系列處理後,投入發音詞典模型中才能顯示出更大的意義。隻有對發音詞典中的每個單詞經過嚴格的标注,才能建構更全面、更精确的發音詞典庫,進而更好地提高語音識别的準确率。

景聯文科技提供語音采集标注服務

景聯文科技作為長三角地區最大的AI基礎資料服務商之一,收集了大量語音資料集。針對人工智能語音工程算法模型訓練提供資料定制采集标注服務,擁有豐富的語音資料采集标注項目經驗,也自建了專業的語音采集錄音室,有高度還原真實場景能力,在全國30多個省市有近一萬人的被采集人員儲備,全球範圍内也有采集管道,支援多語種、多方言語音采集。支援語音識别ASR采集、語音合成TTS采集、喚醒詞采集、多人對話采集、車載語音采集、國語采集、方言采集、英語采集、小語種采集、近遠場采集、語音VAD采集等,采集終端支援大屏、手機、平闆、PC、智能音箱、專業錄音裝置等。可以根據具體的采集标注項目書,對目标領域、場景的特定資料進行采集。自建資料标注基地、先進的資料标注平台和全品類标注工具,支援語音工程,包括語音切割、ASR語音轉寫、語音情緒判定、聲紋識别标注等多種标注類型,可全方位滿足合作方各類資料标注需求,為行業賦能。

景聯文科技:深度了解語音識别之發音詞典及語音資料采集标注

語音采集标注案例:

需求:使用車機在車内采集喚醒詞和車載語音指令資料,用于訓練語音識别模型。

項目難點:需要全國不同區域、不同口音的錄音者;算法輔助标注對部分重口音資料的效果不明顯,人工識别也較為困難。

解決方案:景聯文在全國範圍内都建設有資料采集基地,能夠快速組織各地語符合要求的錄音者;對同一句多種類重口音資料進行多重多人質檢。

景聯文科技:深度了解語音識别之發音詞典及語音資料采集标注

景聯文科技|Al基礎資料服務|資料采集|資料标注|假指紋制作|指紋防僞算法

助力人工智能技術加速數字經濟相關産業品質變革,賦能傳統産業智能化轉型更新

繼續閱讀