Kaldi學習手記：Kaldi的編譯安裝

Kaldi是一款基于C++編寫的開源語音識别工具箱。這款工具既可以在Windows下編譯也可以在Linux下編譯。不過聽學姐說以後還是在Linux下做開發多一些，我就想幹脆順便把Linux環境熟悉熟悉，于是就安了個虛拟機裝上了Ubuntu。文檔裡面也說還是建議在Linux下使用Kaldi。好久沒用過Linux了，也不習慣在指令行下操作，編譯Kaldi還真是費了我一番功夫。下面把過程記錄一下。

一、下載下傳

下載下傳直接利用git版本控制系統就可以了,打開終端，直接在你的實驗目錄下輸入指令：

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

不一會就從github上下載下傳下來了。當然，首先得確定你安裝了git。要是沒安裝的話，就先輸入：

sudo apt-get install git

安裝git版本控制軟體。

二、各目錄功能

下載下傳完畢以後，cd kaldi-trunk進去看看下載下傳了一些什麼東西。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

其中，./tools，./src和./egs這三個目錄是比較重要的。

./tools目錄下面全部都是Kaldi依賴的包。其中主要有：

OpenFST：Weighted Finite State Transducer library，是一個用來構造有限狀态自動機的庫。我們知道隐馬爾科夫模型就可以看成是一個有限狀态自動機的。這是最終要的一個包，Kaldi的文檔裡面說：If you ever want to understand Kaldi deeply you will need to understand OpenFst.诶，要學的好多。
ATLAS：這是一個C++下的線性代數庫。做機器學習自然是需要很多矩陣運算的。
IRSTLM:這是一個統計語言模型的工具包。
sph2pipe:這是賓夕法尼亞大學linguistic data consortium（LDC）開發的一款處理SPHERE_formatted數字音頻檔案的軟體，它可以将LDC的sph格式的檔案轉換成其它格式。

./src目錄存放的是Kaldi的源代碼。./egs存放的是Kaldi提供的一些例子。我們現在要做的就是編譯安裝Kaldi依賴的各種庫，然後編譯安裝Kaldi。

三、Kaldi的編譯

安裝之前需要確定你安裝了這些軟體

apt-get

subversion

automake

autoconf

libtool

g++

zlib

libatal

wget

Ubuntu裡面都有，是以直接開始安裝。

首先安裝依賴包。在./tool目錄下輸入make，開始編譯，輸入make -j 4指令可以加快速度（多核并行處理）。

之後切換到./src目錄下，輸入./configure進行配置，然後輸入make depend，完成之後輸入make進行編譯。當然這個過程也可以并行處理加速，輸入make -j 4。經過漫長的編譯過程以後，就安裝完畢了。

四、運作一個例子

Kaldi自帶的例子都放在./egs目錄下。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

其中最簡單的就是yesno這個例子了。這是一個非常小的資料集，每一條記錄都是一系列yes或者no的語音，标注是由檔案名來标注的。先運作一下。切換到./egs/yesno/s5目錄下，運作sudo ./run.sh指令。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

經過一段時間的訓練和測試，可以看到運作結果。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

WER為0.00。看來這個例子識别的還是挺準的。

PS:WER（Word Error Rate）是字錯誤率，是一個衡量語音識别系統的準确程度的度量。其計算公式是 WER=(I+D+S)/N ，其中I代表被插入的單詞個數，D代表被删除的單詞個數，S代表被替換的單詞個數。也就是說把識别出來的結果中，多認的，少認的，認錯的全都加起來，除以總單詞數。這個數字當然是越低越好。

下面進入./waves_yesno目錄瞧一瞧。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

全部都是.wav格式的音頻檔案。可以打開一個檔案聽一聽，發現是一個老男人連續不停地說yes或者no，每個檔案說8次。檔案名中，0代表那個位置說的是no，1代表說的是yes。這個實驗沒有單獨的标注檔案，直接采用的是檔案名來标注的。

Kaldi學習手記：Kaldi的編譯安裝 Kaldi學習手記：Kaldi的編譯安裝

Kaldi學習手記：Kaldi的編譯安裝

一、下載下傳

二、各目錄功能

三、Kaldi的編譯

四、運作一個例子

繼續閱讀

華為又對計算機視覺下手了！

回顧人工智能大爆炸的引爆點（The origin of the AI big bang）

alphaGo的前世今生，并不那麼玄乎

AlphaGo：從直覺學習到整體知識

AI修複後的王祖賢和林青霞，真的是人間絕色啊

AI空前火爆，“智能時代”真的到來了嗎？

【初創公司系列】Runway - 機器學習和人工智能徹底改變藝術與創意世界

AI—資料中毒

英國最新報告：40% AI公司其實沒用任何AI技術40%的AI公司是假AI？打上AI标簽，投資能多拿一半AI技術落地應用榜

阿裡文娛永叔：利器or成本損耗？算法不是黑匣子

感覺機(Perceptron) Python實作scikit-learn 方法

沒錯! AI已經開始“引領”服裝潮流趨勢了

用Matlab搞計算機視覺是怎樣的體驗？

人工智能有朝一日真的能取代人類教師嗎?

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

人工智能如何有效地運用于自然語言處理