天天看點

Amazon Alexa系列介紹(2)--AVS設計指南

Alexa使用者期望獲得熟悉的使用者體驗。使用如下的設計和實作指南可以讓AVS內建滿足使用者的預期。

Application Examples:确定産品因素,選擇使用者怎樣與Alexa互動。

有兩個方式啟動與Alexa的互動:接觸和聲音。接觸方式依賴一個實體控制,比如遙控器或Amazon Tap,語音方式使用喚醒詞“Alexa”,比如Amazon Echo。下面列出典型的應用案例,分别通過按鍵啟動交談、敲擊啟動交談、聲音喚醒詞啟動交談。

Amazon Alexa系列介紹(2)--AVS設計指南

ASR(Automatic Speech Recognition) Profile Selection:确定最好的自動語音識别模式。Alexa使用自動會話識别(ASR)和自然語言了解(NLU)的組合來了解使用者的語音并精确回報。ASR将語音轉成文字,NLU将文字轉換成指令。最後Alexa發送指令到對應的産品,執行某個具體的操作,比如播放音樂。

對應于不同的産品、形狀、聲學環境和應用場景,AVS提供三種ASR模式。模式參數在每個“識别事件(Recognize event)”消息負載中發送給Alexa,并且也用于顯示使用者語音的結束是由用戶端确定還是由雲端來确定。(怎樣确定語音結束被成為語音終點檢測(speech endpointing))典型的ASR模式如下圖所示:

Amazon Alexa系列介紹(2)--AVS設計指南

**Hardware and Audio Algorithms:**review技術名額,使語音識别最優化。正确的硬體配置和音頻處理算法可以提高産品的聲音喚醒的靈敏度,對于有音樂播放和嘈雜背景的産品設計更是如此。下表列出了典型的硬體配置要求。

Amazon Alexa系列介紹(2)--AVS設計指南

噪聲抑制(Noise Reduction)、回聲消除(AEC)、波束成形(Beamforming)是聲音處理方面的通用技術,參見聲音處理相關的技術文檔。

Third-party Resources:了解硬體和軟體解決方案供應商。下面列出典型的喚醒詞和音頻處理系統的第三方供應商。請參考制造商的産品資訊確定滿足設計需要。

Amazon Alexa系列介紹(2)--AVS設計指南