天天看點

評論:語音識别适合網絡應用

微軟的語音識别技術以及對揚聲器獨立的語音識别軟體的出現,讓我們開始關注語音識别技術的發展和應用。

IT行業有時候看起來就好像是城市中的公共汽車,可能很多年都沒有變,但是突然出現了大量的改變。最近,Nuance公布了它最新版的語音識别軟體Dragon Naturally Speaking 9,而微軟也在經曆過一次慘痛的失敗後,在SpeechTEK大會上重新推出了他令人印象深刻的語音技術産品。

我曾經用過這兩個語音識别軟體的前一個版本,客觀地說,如果使用高品質的麥克風,它們都有很好的表現。雖然我還沒有用過Dragon 9,但是據用過的人說,它比以前的版本有了很大的進步。除了精确度有所提高外,它也是第一個具有獨立揚聲器模式的語音識别軟體。如果這一功能真的有效,那麼将為語音識别技術打開一個廣闊的應用空間。

我一直認為對着電腦說話是應該被避免的,不過微軟看上去好像并不認同,從他在Windows Vista中加入語音識别技術就可以看出。而且我認為當Windows Vista大面積發行後,微軟将更加公開推動語音識别技術,但願這不會導緻像在公車上大聲講電話這種不文明行為的泛濫。

目前各界對于語音識别技術的研究熱情令我有些驚訝,很多大型企業都有這方面的專業研究團隊,各大院校的有關研究也很多。如果不是要對着電腦說話,如此大規模的研究又是為了什麼?也許答案是網絡應用。

歐洲電信标準協會(Etsi)有一個叫做Aurora的項目,即開發一套在移動網絡上的分布式語音識别應用标準。該标準規定,部分語音識别引擎工作在移動終端裝置上,并将語音傳輸給識别中心。我對這種應用的接受程度比前面所說的要大,畢竟對着手機說話要比對着筆記本說話容易被人接受。

Etsi表示,語音識别的其中一項應用是使用者在路上對着電話講述會議内容,然後将這些内容通過郵件發送給自己,以便在回到辦公室或回到住所之後再對會議内容進行進一步編輯。這聽上去挺不錯的,使用者不會再去考慮其它一些網絡服務商所提供的類似收費服務了。

正如目前流行的SpinVox 服務所展示的,使用者在收到語音信箱的留言後,不是聽到錄音,而是看到留言的文字内容。一個中央語音識别系統可以讓企業網絡也具有類似的功能,由于微軟的Office Communications Server 2007 内置了語音識别技術,是以也許這會是企業的一個不錯的選擇。

比爾。蓋茨說,語音識别技術将成為未來十年的一個主流技術,這一點我也認可,但是這種技術在網絡應用中的規模也許比在獨立PC應用上的規模更大。無論如何,企業現在也應該開始考慮一下,語音識别技術到底是不是會對自己的系統效率有提高作用。

原文出處:科技行者

轉載請與作者聯系,同時請務必标明文章原始出處和原文連結及本聲明。

繼續閱讀