查看: 3722|回复: 7

kaldi安装[kaldi-tf1.12使用指南]

[复制链接]

38

主题

84

帖子

243

积分

中级会员

Rank: 3Rank: 3

积分
243
发表于 2019-1-16 09:30:48 | 显示全部楼层 |阅读模式
本帖最后由 lsh 于 2019-4-15 12:17 编辑

kaldi-tf1.12镜像,已经将kaldi安装所需的包,都准备好。用户购买此镜像后,只需按步骤去执行即可。

安装流程[五大步骤]
1. 开机。建议选 1050ti + 8核CPU + 10G内存。

2. 将Kaldi-master拷贝并解压缩到MyFiles文件夹。

Kaldi-master在哪里?
文件路径:/home/ubuntu/MyFiles/PublicData/advanced/SpeechAudio/Kaldi
12dfwe.png

3. 安装支撑(三小步)
(1) 切换到tools目录

(2) 运行:
extras/check_dependencies.sh
[不报错,出现successfully,说明成功]
(3) 运行:

make -j X  
[注意:X是数字,等于你租用的CPU核的数目]
[无报错,顺利完成,说明成功]


4. 编译Kaldi源码(四小步)
(1) 切换到src目录
(2) 运行:
./configure --shared
(3) 运行:
make depend
(4) 运行:
make -j X  
[注意:X是数字,等于你租用的CPU核的数目]


5. 验证是否安装成功
进入egs/yesno/s5目录,执行 ./run.sh 脚本

出现%WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] exp/mono0a/decode_test_yesno/wer_10_0.0时,恭喜你,Kaldi安装成功!

################################################################
################################################################
安装过程详解
[1] CPU核心数,可用命令 nproc 查看(我用的是虚拟机安装Ubuntu,尝试下来表明不能全开CPU,否则Ubuntu容易死)

[2] 现在的kaldi版本已经不默认安装 IRSTLM (一种语言模型工具),如果有需求,可自行安装。如下所示:
extras/install_irstlm.sh

[3] src目录的make时间较长,耐心等待,出现Done且不报错时表明已安装结束

[4] 验证一下是否安装成功
进入egs目录,用命令 cat README.txt 查看用例,egs下面包含如voxforge,vystadial_{cz,en},yesno和LDC用例
这里用yesno为例
进入egs/yesno目录,用命令cat README.txt 查看yesno数据集介绍,是一个关于Yes/no识别的简单的数据集
进入egs/yesno/s5目录,执行 ./run.sh 脚本
出现%WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] exp/mono0a/decode_test_yesno/wer_10_0.0时,恭喜你,Kaldi安装成功!

Kaldi目录介绍
进入Kaldi-master可以看到,./tools,./src和./egs这三个目录是比较重要的。
./src目录存放的是Kaldi的源代码。
./egs存放的是Kaldi提供的一些例子。
./tools目录下面全部都是Kaldi依赖的包。其中主要有:
OpenFST:Weighted Finite State Transducer library,是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最终要的一个包,Kaldi的文档里面说:If you ever want to understand Kaldi deeply you will need to understand OpenFst.
ATLAS:这是一个C++下的线性代数库。做机器学习自然是需要很多矩阵运算的。
IRSTLM:这是一个统计语言模型的工具包。
sph2pipe:这是宾夕法尼亚大学linguistic data consortium(LDC)开发的一款处理SPHERE_formatted数字音频文件的软件,它可以将LDC的sph格式的文件转换成其它格式。

为何不预先安装kaldi?
这是kaldi的特性决定的。我们预先执行了这些过程,用户仍然没法调用。因为用户操作中,会修改kaldi目录的内容。所以,我们必须要将kaldi-master放到MyFiles下面。
这样,用户这次用完关机、下次再来时,在kaldi-master之上的修改,仍在。


回复

使用道具 举报

38

主题

84

帖子

243

积分

中级会员

Rank: 3Rank: 3

积分
243
 楼主| 发表于 2019-1-16 09:33:20 | 显示全部楼层
kaldi的安装
网络教程很多
但很多是不完整的

特别是
很多教程,没写在src,还要再make一次。
坑啊
回复

使用道具 举报

665

主题

1234

帖子

6684

积分

xdtech

Rank: 5Rank: 5

积分
6684
发表于 2019-1-16 22:43:34 | 显示全部楼层
以上过程
已证实
是正确的安装过程
回复

使用道具 举报

166

主题

616

帖子

1万

积分

xdtech

Rank: 5Rank: 5

积分
11705
发表于 2019-1-22 14:46:10 | 显示全部楼层
这个是已经成功的过程
很好的介绍
回复

使用道具 举报

665

主题

1234

帖子

6684

积分

xdtech

Rank: 5Rank: 5

积分
6684
发表于 2019-1-24 16:10:14 | 显示全部楼层
很好
终于搞通了
kaldi好东西
回复

使用道具 举报

38

主题

84

帖子

243

积分

中级会员

Rank: 3Rank: 3

积分
243
 楼主| 发表于 2019-4-9 18:29:16 | 显示全部楼层
用户操作中,会修改kaldi目录的内容。所以,我们必须要将kaldi-trunk放到MyFiles下面。
这样,用户这次用完关机、下次再来时,kaldi-trunk与所做修改,仍在。
回复

使用道具 举报

166

主题

616

帖子

1万

积分

xdtech

Rank: 5Rank: 5

积分
11705
发表于 2019-4-13 23:30:56 | 显示全部楼层
这个教程
可以
回复

使用道具 举报

38

主题

84

帖子

243

积分

中级会员

Rank: 3Rank: 3

积分
243
 楼主| 发表于 2019-4-15 12:18:04 | 显示全部楼层
安装过程 凸显出来
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表