天天看點

痞子衡嵌入式:語音處理工具pzh-speech誕生記 - 索引

智能語音互動市場近年來發展迅速,其典型的應用之一智能音箱産品如今已走入千家萬戶,深受大家喜愛。智能音箱産品的核心就是語音處理,包括音頻采集、語音識别(ASR)、自然語言處理(NLP)、文語合成(TTS)、音頻播放五大部分。目前除了音頻采集和播放必須在嵌入式端實作外,其餘三部分一般都在雲端處理(嵌入式端通過有線(USB)或無線(Wifi/BLE)将音頻資料發送到雲端)。痞子衡對語音處理一直比較感興趣,最近在玩Python也注意到Python裡有很多語音處理庫,是以打算從零開始寫一個基于Python的語音處理工具,這個語音處理工具我們暫且叫她pzh-speech。

  大家好,我是痞子衡,是正經搞技術的痞子。本系列痞子衡給大家介紹的是語音處理工具pzh-speech誕生。

  智能語音互動市場近年來發展迅速,其典型的應用之一智能音箱産品如今已走入千家萬戶,深受大家喜愛。智能音箱産品的核心就是語音處理,包括音頻采集、語音識别(ASR)、自然語言處理(NLP)、文語合成(TTS)、音頻播放五大部分。目前除了音頻采集和播放必須在嵌入式端實作外,其餘三部分一般都在雲端處理(嵌入式端通過有線(USB)或無線(Wifi/BLE)将音頻資料發送到雲端)。痞子衡對語音處理一直比較感興趣,最近在玩Python也注意到Python裡有很多語音處理庫,是以打算從零開始寫一個基于Python的語音處理工具,這個語音處理工具我們暫且叫她pzh-speech,初步計劃為pzh-speech設計4大功能:wav音頻錄制,語音識别,文語合成,音頻播放,第一個穩定正式版v1.0.0效果如下:

痞子衡嵌入式:語音處理工具pzh-speech誕生記 - 索引
pzh-speech的github: https://github.com/JayHeng/pzh-py-speech.git