细说Linux上的语音识别(1)


很久以来,与计算机进行交谈一直是科幻小说惯用的故事情节,直到今天真正的交谈也只有在小说中才能实现。但是在过去的十年中,语音识别软件的发展速度非常迅速。目前,市面上出现了多种支持不同操作系统的语音识别控制软件。也许许多人并没有意识到Linux桌面系统也完全可以用声音来控制,并且软件开发人员们已经取得了一定的成果。下面我们就对Linux系统下的语音识别软件进行分析概括,以便帮助大家了解其优势和缺陷。

Linux上的语音识别软件

Linux系统下的语音控制软件可以为身患残疾或由于过度使用计算机而患计算机综合症的人提供使用Linux系统的机会。此前他们不得不改装其它的操作系统,以获得语音识别技术支持。即使不考虑特殊因素,普通人也可以通过使用语音识别软件,使操作计算机变得更为简单有趣。尽管本文对语音识别系统未来的发展趋势深表忧虑原因是它们并不能完全把手解放出来),但是它们的确可以分担一部分手的工作。

目前已经有两种套装软件中含有支持Linux系统的语音控制软件。一种是IBM 开发的支持Linux的ViaVoice,它可以提供一些基本的语音识别功能;另一种是GPL下的Xvoice,它通过ViaVoice库来为桌面系统和应用程序提供语音控制功能。

IBM 的Linux ViaVoice是美语版本,目前只在美国和加拿大销售。它的售价大约是40美元,包括送货费和一副耳机。用户也可以从IBM的网站上下载ViaVoice,并可享受一定的价格优惠。新版本的ViaVoice在Mandrake 8.0 PowerPack和ProSuite中也可以找到。目前,Mandrake ViaVoice既可以支持英国英语,也可以支持美国英语、法语和德语。Mandrake 8.0以后的版本将不再包含ViaVoice。本文将着重介绍IBM ViaVoice的安装和使用。

应用ViaVoice

Linux ViaVoice需要机器的配置为:Pentium MMX 233以上的CPU、128MB的内存,以及16位的声卡。实际上, ViaVoice是专门为Red Hat 6.2设计开发的,但是用户在Red Hat 7.3环境和其它Linux版本中也可以正常地运行 ViaVoice。当然用户也有可能在安装过程中遇到一些问题。

在安装ViaVoice语音识别软件前,要首先安装Java运行环境。ViaVoice 1.0和1.1版本是在JRE-1.2.2环境下进行测试的。使用正确的版本可以避免在不同JRE环境下的不兼容。

JRE安装完毕后,将安装盘放入光驱并运行根目录下的vvsetup,然后再运行vvstartuser将自己设为ViaVoice用户,并且设置好适当的音量,最后便是反复练习,使软件适应自己的声音。切记安装顺序决不能颠倒。

“调教”ViaVoice

与其它语音识别软件一样,第一次安装的ViaVoice并不能对用户的声音识别得十分准确。使用者必须对它进行一番“调教”,然后才能使它识别使用者的声音。

“调教”ViaVoice的一种方法就是按照用户手册中的词语反复的朗读。对于大多数用户来说,这一点并不难,但是手册中的词语也许并不是用户经常用到的,因此这个方法的效率并不是很高。

比较好的方法是在工作时利用ViaVoice的Dictation应用软件。它是用Java语言写成的。当用户进行口述时,一些词语也许不能被正确识别,当这种情况发生时,用户可以使用Dictation中的适当工具对其进行修改。这样ViaVoice便可以对识别工具进行修正,以便更精确地识别用户的声音。这种方法也许会花费较多的力气,但是类似的修改可以用语音命令来完成。不过请注意随时存盘,因为Dictation并不十分稳定。

曾经有一位专家说,目前的语音识别软件只要经过10到60小时的“调教”,便可以达到98%的正确率。但是到目前为止,对Linux环境下的 ViaVoice进行测试的结果是,它的正确率只有92%到95%,绝大多数的语音命令都可以被正确识别。即使用户只花费几个小时进行练习,也可以发现 ViaVoice的正确率明显提高。不过用户在使用时要特别注意,词语的发音、麦克风的质量和周围环境都会影响语音识别的正确率。


相关内容