感谢支持
我们一直在努力

Kaldi语音识别库在Linux下的安装和编译

1.介绍

Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成,可以说是HTK的升级加强版。

kaldi官方网站请见:http://kaldi.sourceforge.net/index.html

2.安装和编译

第一步:下载kaldi工具包

kaldi 有两个版本,kaldi-1和kaldi—trunk,前者是稳定版,后者是新版。我安装的是新版。

下面开始安装:

sudo apt-get install subversion
svn update
svn co https://kaldi.svn.sourceforge.net/svnroot/kaldi/trunk kaldi-trunk
cd kaldi-trunk
cd tools
cat INSTALL
make  -j 4

注:

1.当电脑有不止一个cpu时,假设有四个,可以输入:make -j 4 以节省时间。

2.make指令是为了安装8个软件,其中,(sph2pipe, openfst, ATLAS)这3个是必须的。

第二步:配置

cd ../src
./configure

注:通常这个时候会报错,那是因为没有安装openfst或者ATLAS。

安装openfst:

1.安装g++

sudo apt-get install g++

2.解压

tar -xovzf openfst-1.3.2.tar.gz
for dir in openfst-1.3.2/{src/,}include/fst; do
    ( [ -d $dir ] && cd $dir && patch -p0 -N <../../../../openfst.patch )
done
rm openfst 2>/dev/null # Remove any existing link
ln -s openfst-1.3.2 openfst
cd openfst-1.3.2

以下选择正确的配置指令:

若是linux或darwin,

./configure –prefix=`pwd` –enable-static –disable-shared

若是64位系统,

./configure –host=x86_64-linux –prefix=`pwd` –enable-static –disable-shared

若是虚拟机,

./configure –prefix=`pwd` CXX=g++-4.exe CC=gcc-4.exe –enable-static –disable-shared

3.安装

sudo make install

安装ATLAS:

注:安装ATLAS前,要保证关掉cpu throttling。绝大部分操作系统默认开启power management中的cpu throttling以保护cpu。绝大部分电脑可以在BIOS中关掉cpu throttling(通常在power management中或cpu frequency 选项中。)绝大部分操作系统也能关掉cpu throttling,在Fedora中,输入/usr/bin/cpufreq-selector -g performance可以关掉cpu throttling。本机器是Ubuntu 12.04 cpu frequency scaling governor的路径是(/sys/devices/system/cpu/cpu0/cpufreq/scaling_governor)。此处建议使用:https://wiki.archlinux.org/index.php/CPU_Frequency_Scaling_(简体中文)中的修改软件,修改后是临时的,重启之后恢复默认设置,这样不会对基础设置造成影响。

具体操作:

sudo apt-get install cpufrequtils
sudo cpufreq-set -c 1 -g performance
sudo cpufreq-set -c 2 -g performance
sudo cpufreq-set -c 3 -g performance
sudo cpufreq-set -c 4 -g performance
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
cat /sys/devices/system/cpu/cpu1/cpufreq/scaling_governor
cat /sys/devices/system/cpu/cpu2/cpufreq/scaling_governor
cat /sys/devices/system/cpu/cpu3/cpufreq/scaling_governor

查看里面的选项ondemand是否均改为performance。

除了更改cpu throttling,还要安装gfortran,否则会出错:

sudo apt-get install gfortran

最后,在tools目录下输入:

./install_atlas.sh

完成ATLAS的安装。

第三步:配置安装:

../src

./configure

make depend

make -j 4在一段时间之后就会有提示出现,显示安装成功。

Linux下安装编译并且测试HTK语音识别库 http://www.linuxidc.com/Linux/2013-03/80801.htm

赞(0) 打赏
转载请注明出处:服务器评测 » Kaldi语音识别库在Linux下的安装和编译
分享到: 更多 (0)

听说打赏我的人,都进福布斯排行榜啦!

支付宝扫一扫打赏

微信扫一扫打赏