2018雲栖大會深圳峰會阿裡雲IoT物聯網技術專場上,阿裡雲IOT事業部進階技術專家龍一民在深圳雲栖大會給大家介紹了AI賦能語音互動Link Voice。從内容和智能家居生态角度闡述了Link Voice的廣闊前景,着重從從前端硬體,數字信号處理,到雲端資料處理詳細分析了Link Voice的優勢。
數十款阿裡雲産品限時折扣中, 趕快點選這裡 ,領券開始雲上實踐吧! 直播視訊回顧以下為精彩視訊内容整理:
雲平台簡介目前市場主流的智能語音平台為阿裡雲、Google、Amazon和蘋果公司。Link Voice雲平台是阿裡雲研發的智能語音平台,旨在通過阿裡雲平台資源幫助更多公司及使用者實作智能語音互動。

我們把智能家居分為家居、家電、運動健康和汽車車載等四個場景,這些場景裡面的裝置都會具有語音互動能力。個人猜想掃地機器人未來除了語音互動能力之外還添加視覺采集能力,這樣具備巡邏能力的裝置可以幫使用者觀察家裡房間安全、老人和兒童的位置安全等功能。同時運動健身方面智能耳機也是我們關注的一個裝置,去年蘋果釋出了Earpods,阿裡雲也和侯氏聯合在設計一款藍牙耳機,在耳機裡内置本地化處理、本地化喚醒等技術。去年我們也和新中心合作了車載藍牙市場,之後釋出了基于藍牙耳機的解決方案,也是支援本地喚醒的。
Link Voice平台有兩大優勢,一個是内容優勢,另一個是智能家居生态優勢。由上左圖調研報告中可以看出,大家最感興趣的雲端内容其一是智能家居控制,其二是資訊擷取比如音樂、電台等内容。在AliOS Things上可以找到版權超過兩千萬的蝦米音樂,還有喜馬拉雅、蜻蜓FM、貝瓦兒歌等内容合作夥伴。在智能家居生态方面,現在已經擁有超過千萬台裝置在阿裡雲上運作。通過雲端系統,不僅可以讓裝置控制裝置本身,也可以讓裝置控制其他裝置的操作。甚至可以告訴家裡的冰箱,半小時之後打算出門,請計程車停在北門這樣的指令,都可以幫助使用者完成。
端子產品介紹語音産品從前端硬體,到數字信号處理,到雲端資料處理,其實是一個多領域交叉融合的産品。是以Link Voice把每一類問題細分并解決處理,提供給大家一站式開發能力。由上圖可以看到,Link Voice在硬體方面具備多項優點,可以相容多個作業系統,聲學信号處理方面具備聲源定位、回聲消除、噪音消除等特點,算法方面概括多項主流操作,并且依賴于阿裡雲平台各項資源,具有強大競争力。
在整個語音行業裡面,Link Voice實際上是提供了很多B2B、B2C的商業模式。有很多傳統家具家電行業合作廠商,會把産品進行語音化改造,經過一站式開發和平台賦能之後,最後經過驗收測試,推廣到應用市場上。Link Voice支援廠家或者使用者可以自定義語音喚醒詞,更加滿足多元的使用者體驗。
在互動方式方面,大家可以看到最後的硬體裝置分類。Push Talk就是裝置上有一個按鍵,開始按同時識音開始,結束按識音結束。Tab Talk意思是裝置上有按鍵,開始按同時識音開始,系統自動判别結束時間點。Far Field就是所謂的無接觸式遠場識音,就是通過喚醒詞喚醒。目前這三種喚醒方式Link
Voice都支援。
産品介入研發流程下面着重和大家介紹,如何利用Link Voice做出一個屬于自己的雲單品。
在作業系統AliOS Things上,會有一個WiFi的id,還有一個DSP本地聲控或者本地神經網絡的部分,主要是做本地化識音處理,以上構成了一個經典的裝置模組模型。
然後在麥克風陣列的數量上面,Link Voice也支援本地端麥克風陣列自定義。當然數量越多價格越高。
以跑步機為例,如果客戶自由一個智能化的單品希望借助雲的能力。一般是先提供産品模型,了解到産品的模型,我們會幫助産品挑選核實的合作夥伴及類型。舉個例子,如果不需要本地化的模組,就可以通過輕量方式連接配接雲端;如果需要本地化處理,可以接入合作商家晶片做本地喚醒或者本地語音識别模組。之後安裝麥克風,接下來開發者可以利用一站式開發平台開發适合自己的語音互動應用,我們所有的雲端資源都是開放的。最後進行産品認證測試,Link Voice産品的聲學驗證測試包括基本功能測試集、常用指令識别率音響裝置互動控制、誤喚醒率、喚醒率等名額。利用消音室、半消音室、環境噪音等條件,從不同方位,從使用者不同的聲音音調、分貝數等方面,對産品做一個全方位的認證和測試,測試過後可以釋出上線。
我們的宗旨就是希望借助阿裡雲平台的力量,和供應商、開發者一起為傳統的實體世界裡面的物,提供語音互動能力,希望能得到更多的支援和合作。
本文由雲栖志願小組王曉慧整理編輯