天天看點

語音識别:市場前景可觀,但核心技術仍需突破

在CES 2017之後,語音識别成為了衆人的關注焦點,而在市場規模擴大的背後,語音識别還不能完全滿足人類的需求。

随着人工智能産品在生活中的滲透率越來越高,其中技術的發展也成為了衆人關心的重點所在。作為人機自然互動的基本途徑之一,近期以來,語音識别的發展不可謂不快速。

當下,諸如科大訊飛、百度等多家企業聲稱,其研發的語音識别技術已經達到了97%的準确率。而在日前,谷歌研究員公開表示其語音識别的錯誤率(将一個詞語從語音轉錄成為文字時的錯誤率)自2012年以來已經降低了30%以上……縱觀過去的2016年,谷歌、蘋果和微軟等多家科技巨頭都公布了自己在語音識别上的進展和突破,而在接下來的時間裡,語音識别也将是2017年的發展重點之一。

語音識别:市場前景可觀,但核心技術仍需突破

新興産業市場廣闊,推動語音識别技術發展

在剛剛過去不久的CES 2017展會上,我們見到了許多人工智能産品,要是來一場評比大賽,自動駕駛和智能家居絕對是主角。不過,再往深究,語音識别技術才是此次展會人工智能部分的“亮點”。

語音識别:市場前景可觀,但核心技術仍需突破

智能家居

在智能家居,不管是智能家電還是

機器人

,語音識别技術都是必備的基本功能之一。據知名市場調研公司《Markets And Markets》釋出的調查報告稱,全球智能家居市場規模将在2022年達到1220億美元,2016-2022年年均增長率預測為14%。而在機器人方面,研究機構IDC預測,至2020年,全球機器人與相關服務市場規模将由2016年的915億美元增至1880億美元。從這兩點資料來看,可想而知未來智能家居的市場之大。

在控制方式上,除了部分智能家電之外,語音控制已經成為了市場的主流,而這就是語音識别市場的商機。未來,作為人機自然互動的前提之一,語音識别必然是智能家居的發展趨勢,隻有語音識别的準确率接近完美,人機的自然互動才能繼續開展。在智能家居市場的推動下,語音識别技術必将成為重點發展對象。

語音識别:市場前景可觀,但核心技術仍需突破

智能汽車

在CES 2017展會上,各大傳統汽車制造商都帶來了自己在自動駕駛汽車的最新成果。與此同時,在展會上,除了展示成果,不少廠商也宣布了自己的一系列計劃,其中就包括在汽車中加入虛拟助手平台,以促進人車互動,進一步提升使用者體驗,比如日産、寶馬與Cortana的合作,還有福特與Alexa的聯手。

根據美國市場研究機構勒克斯的研究報告顯示,自動駕駛汽車将在2030年創造價值870億美元的市場。此外,另有研究顯示,2030年全球範圍将售出約1.2億輛自動駕駛汽車。從資料來看,自動駕駛汽車的市場十分具有看頭。

自動駕駛市場的推動下,人車互動也成了自動駕駛玩家的一個關注點,是汽車智能化的一部分。此外,相對于自動駕駛輔助技術,語音識别等互動技術的實作則容易得多,目前也已有不少車型搭載了語音識别技術。在智能汽車中,語音識别已經成為了一項基礎的服務,而随着智能化時代的來臨,人們對語音識别的要求也會進一步提升。

語音識别:市場前景可觀,但核心技術仍需突破

未來市場可觀,而語音識别仍需“做事”

在新興産業市場需求的推動下,語音識别的市場也是十分具有看頭的,有研究機構指出,預計到2020年,全球語音識别的市場規模将從2015年的61.9億美元增長到200億美元。然而,在市場規模壯大這一美好的預測面前,我們也不能忽視一些需要面對的問題,隻有解決了它們,語音識别才能得到完善,給使用者帶來極緻服務。

語音識别:市場前景可觀,但核心技術仍需突破

首先就是對象識别的準确性。現在,在應用上,我們看見語音識别多是在智能家居領域,包括智能家電和服務機器人。此時,我們就要考慮一個問題了,當多個家庭成員同時講話時,智能家電和服務機器人該執行誰的指令呢?它們又如何能在衆聲音中找出自己主人的指令?這些都是目前語音識别所需要解決的問題,畢竟我們通常所說的語音識别不僅僅隻是單純的對語音内容進行識别。

在這個問題上,人們也找到了一個解決方案——聲紋識别。一般來講,聲紋具有唯一性,對說話人身份的确認有着極大的幫助。借助于聲紋識别,語音識别能夠準确對說話人的位置和身份進行定位,進而準确識别語音内容,執行其中下達的指令。不過,鑒于資料的極大空缺等問題,聲紋識别技術還需完善。

語音識别:市場前景可觀,但核心技術仍需突破

其次是降低周邊環境的幹擾。對于人類來講,在嘈雜環境中聽别人說話或是從衆多聲音中找出自己想聽的内容還是一件較為簡單的事,而與此相反,這件事在機器這裡并沒有那麼容易。

為了降低周邊環境對語音識别的幹擾,亞馬遜和谷歌都在智能音箱中使用了麥克風陣列技術,進而起到一定的“降噪”作用,增加語音識别的準确率。不過,到目前為止,環境的幹擾依然沒有得到更好的解決,仍然是語音識别前進道路中的一隻“攔路虎”,尤其是在多段語音中準确找出指定說話人的情境中。

語音識别:市場前景可觀,但核心技術仍需突破

在一次采訪中,

人工智能

和機器學習權威學者、百度首席科學家吳恩達表示,2017年是“對話式電腦”快速發展的一年。對話式電腦,諸如聊天機器人、人工智能虛拟助手之類,作為展開對話的第一步,語音識别也屬于這快速發展的一部分。

等多種産業以及聊天機器人、虛拟助手這些産品市場的推動下,語音識别的市場正在不斷擴大,同時也是對它準确性的一個挑戰。

2016年,在語音識别内容的準确率上,各科技企業和團隊都有了相應的突破,而在接下來的一年裡,如何降低周邊環境的幹擾以及如何提高對聲音的識别準确率将是語音識别所要解決的問題。

原文釋出時間:2017-01-16 18:23

本文作者:韓璐

本文來自雲栖社群合作夥伴鎂客網,了解相關資訊可以關注鎂客網。

繼續閱讀