天天看点

kaldi安装

文章目录

    • 1. Ref
    • 2. 编译
    • 3. 测试yesno数据集
    • ❤ 致谢

1. Ref

Kaldi官网 包括一大堆原理和工具的使用说明,有什么问题请首先看这个。

Kaldi Lecture 相比于上一个会给一个更简略的原理、流程介绍。

Kaldi中文翻译1 如果感觉英语读起来比较头疼的话建议搜一下这个来看看,是对官网上文件的翻译。这个文档来源于一个学习交流Kaldi的QQ群。

Kaldi中文翻译2

《语音识别实践》俞栋 大概是唯一能get到的中文参考书籍了吧- -涉及到初步的原理介绍。

2. 编译

主要参考[1][2]

  • 检查依赖包是否齐全
[[email protected] extras]# cd tools/extras
[[email protected] extras]# ./check_dependencies.sh
./check_dependencies.sh: all OK.
           
  • 编译tools下的文件
[[email protected] extras]# cd ../
[[email protected] tools]# make
。。。。。。
Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.
           

这里出现警告 IRSTLM库没有安装,其他一切OK

键入 ./extras/install_irstlm.sh 安装IRSTLM,由于可能下载不成功,请先手动下载下来后,把下载和解压等脚本注释掉,然后跑脚本,这种方式应该是可以跑过的。

  • 编译src下的文件
[[email protected] tools]# cd ../src
键入 ./configure --shared检查外部库安装情况,根据提示进行安装,此步骤可以查看--help设置用不用cuda
键入 make depend 进行预编译
键入 make 或者 make all 进行编译,make耗时较长请耐心等待。
           

3. 测试yesno数据集

测试kaldi是否编译成功,主要参考[1][2]

cd egs/yesno/s5

./run.sh

运行结果在 egs/yesno/s5/exp/mono0a/log

s5文件夹下的内容

  • conf文件夹里是一些配置文件例如MFCC的参数 HMM的拓扑结构;
  • local文件夹里主要是一些准备数据的脚本,供顶层脚本run.sh调用;
  • steps和utils文件夹里主要是一些运行时调用的脚本;
  • data文件夹里主要存放语言模型、发音字典和音素信息等等。

❤ 致谢

【1】基于kaldi和CVTE开源模型的中文识别

【2】Kaldi安装

文章目录

    • 1. Ref
    • 2. 编译
    • 3. 测试yesno数据集
    • ❤ 致谢

继续阅读