語音互動事關未來,國内外已經不少公司在搶蛋糕了,大公司收購、投資、合作不斷,就可見一斑。目前,基本上所有的巨頭都有涉足。
蘋果收購siri、novauris,組建基于神經網絡算法的語音識别團隊
2014 年 7 月,有消息稱,蘋果正在聯系多位語音識别技術的專家,正在招聘經理、小組負責人、研究員,很可能将成立一支強大的語音識别團隊,并最終取代現在的 siri 技術服務商 nuance。過去幾年中,蘋果招聘了多名此前供職于 nuance 的的高層次語音技術研究員,包括前研究副總裁拉裡·吉利克 (larry gillick)、siri 的項目經理貢納爾·艾弗曼(gunnar evermann)、微軟語音識别項目高管亞曆克斯·阿賽洛(alex acero)。
在 2013 年,蘋果收購了自動語音識别公司 novauris technologies。novauris 是英國研究機構 dragon systems 旗下的附屬公司,以語音聽寫識别著稱,成立于 2012 年。當然,怎麼能忘了最著名的那筆收購呢,2010 年 4 月,以 1.5~2.5 億美元收購了 siri。
google收購多項語音識别技術專利、saynow 、phonetic arts
google 在 2014 年收購了 sr tech group 的多項語音識别相關的專利,其中包括“ 搜尋引擎語音界面” 和“ 修改、更新語音識别項目系統”的專利。
google 一直緻力于投資語音搜尋技術,以期與蘋果公司的 siri 展開競争。2011 年,google收購語音通信技術公司saynow 和語音合成技術 phonetic arts。 其中,saynow 建立于 2005 年,可以把語音通信、點對點對話、以及群組通話和 社交應用整合在一起,支援的裝置包括 pc 浏覽器、智能手機乃至座機。被收購時,有 1500 萬使用者,旗下産品包括 saynow phone,saynow 廣播,big call 以及 chit chat 等。
facebook收購wit.ai和mobile technologies
語音互動解決方案服務商 wit.ai 要做的就是重寫網際網路的語音層,簡單地在第三方 app 中加入幾行代碼來為它生成一個語音互動界面,就能把語言轉化成可以操作的資料。正如移動支付公司 stripe 通過幾行代碼就為網站解決了線上支付問題一樣。wit.ai 稱,它比 siri 更靈敏精确,不需要開發者先期投資,或訓練資料集,而且可以應用在移動應用程式 (ios、android 等平台)、穿戴裝置和機器人以及幾乎任何你可以想到的智能裝置。被收購時,wit.ai 成立才 18 個月,吸引了 6000 多名開發者,建立的應用超過了數百個。此次收購有助于提高 facebook 整體對自然語言的了解能力。
除了 wit.ai,facebook 還在 2013 年收購了語音識别公司 mobile technologies。mt 建立于 2001 年,在 2009 年推出了 jibbigo 應用,允許使用者在 25 種語言中進行選擇,使用一種語言進行語音片段錄制或文本輸入,然後将翻譯顯示在螢幕上,根據你選擇的語言大聲讀出來。
amazon收購語yap、evi、ivona
2011 年,amazon收購語音識别公司yap。yap 成立于 2006 年,主要提供語音轉文本服務,代表應用是 yap 語音郵件。利用 yap 的技術亞馬遜建立自己的語音技術平台,服務于亞馬遜的網上搜尋和客戶服務等領域。
2012 年,amazon 收購語音技術公司 evi。evi 是一家應該創業公司,原名 true knowledge,在獲得了 nuance 語音識别技術的授權後,基于自主的自然語言搜尋引擎開發了一款與蘋果 siri 類似的應用。
2013 年,amazon 收購語音技術公司 ivona software。ivona 是一家波蘭公司,是 nuance 的競争對手,主要做文本語音轉換,被收購時支援 17 種語言 44 種聲音。
英特爾收購語音識别技術公司indisys
2013 年,英特爾收購了語音識别技術公司 indisys。這是一家西班牙公司,但自稱一直在做多語音。在計算語言學、人工智能、認知科學和機器學習領域有研究,不少西班牙公司都采購了他們家的技術。此外,他們還開發了與蘋果 siri 相似的助手界面。
三星或收購語音識别軟體商nuance
關于三星和 nuance 的绯聞已經傳了段時間。nuance 的語音識别技術在智能手機、電視和 gps 導航裝置上都有廣泛應用,比如蘋果的 siri 就是用的它的技術;其他一些企業級市場也有需要用到語音識别的地方,比如醫院裡的電子病曆業務,醫生直接口述就能生成電子病曆。2013 年 9 月份時,nuance 還同三星達成合作。
雅虎收購skyphrase,牽手robin labs
2013 年 12 月,雅虎收購了自然語言處理技術初創公司 skyphrase。gmail 和 twitter 的相關技術支援就是 skyphrase 提供的,允許使用者跟機器說“人話”得到個性化的搜尋結果。比如“nana 發的帶圖微網誌”,或者“jane 發給我的包含照片的電子郵件”——這樣複雜的資訊 siri 是了解不動的。skyphrase 還開發了兩款應用,其中一款能讓使用者檢視夢幻足球的比分統計資料,另一款應用與 google analytics 整合發揮作用。
為了推雅虎語音助手,雅虎還找到了合作夥伴robin labs,後者主要做自然語言識别和導航。除開發自己的私人助手的導航應用外,現在它還為客戶提供語音助手白标産品的開發。”也就是說,理論上講,每個應用都可以添加一個特定的語音助手子產品。既然雅虎語音助手其實是 robin labs 開發的,那它會被收購麼?其實,除了這些大公司和被他們收購的小公司,還有幾家初創公司做的也挺有意思。比如,下面這兩家。
全球首個通過語音來識别情緒的公司beyond verbal
beyond verbal 是一家以色列公司,成立于 2012 年,在情緒識别領域一直領先。beyond verbal 系統建立的算法可以通過識别音域變化,進而分析出像憤怒、焦慮、幸福或滿足等情緒,心情、态度的細微差别也能被識别到。beyond verbal 的情緒識别系統可以分析出 11 個類别, 400 個複雜情緒的變量。
2013 年 1 月,他們開發的情緒識别 app moodies 在 ios 平台釋出;2014 年 8 月,他們開發了 moodies 的安卓版。2013 年 5 月,獲得了 280 萬美元融資;2013 年 7 月,又獲得了 100 萬追加融資。2014 年 9 月,又追加了 330 萬美元種子融資。
在 2014 年耶路撒冷召開的 tedmedlive 上,就引入了 beyond verbal 的技術來對所有與會人員的情緒進行分析,進而總結整個會議的整體回報情況。
英國語音識别初創企業ei
英國的初創企業 ei technologies 也是一家做語音情緒識别的公司,可以分析人聲的音調,監控使用者的情緒。之前從孵化器 wayra london 和英國政府的 technology strategy board 拿到了 15 萬英鎊的種子期融資。
目前系統可識别 5 種基本情緒:高興、悲傷、害怕、憤怒及無感情。識别的準确率約為 70-80% 左右,這個數字要高于人類 60% 的平均水準。而受過訓練的心理學家的判斷準确率約為 70%,從這些資料來看,ei 的算法準确率已經非常可觀。其未來目标是進一步提高到 80-90%。
通過識别并恰當響應語言内容和情緒來增強自然語言處理算法似乎是人工智能系統的下一步發展方向。《銀翼殺手》裡面的複制人的緻命缺陷正是缺乏“移情(empathy)”能力。現在這三家公司的技術正幫助機器朝着具備“移情”能力邁出一小步—首先學會感受人類的情緒。不過這也是個龐大又複雜的工程。
原文釋出時間為:2015-01-30
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号