XVoice控制Linux桌面

当用户完成ViaVoice的安装并训练了一段时间后,便可以安装Xvoice了。Xvoice的作用是对桌面系统及应用软件进行控制。 ViaVoice则没有这些功能。用户可以到xvoice.sourceforge.net去下载Xvoice软件,注意一定要事先安装RPM,因为源程序需要Linux SDK中的ViaVoice中断运行。

安装完成后,在最后出现的窗口中输入xvoice m,注意不要运行Dictation。这时用户可以做一个简单的测试,口述命令“下一窗口”,桌面上应该出现另一个窗口。

Xvoice允许用户事先设定好一些操作的口述命令。一套口述命令被称为一个语法组。语法组可以与确定的应用程序、窗口或者应用程序中的某一模块联系在一起,也可以由上下文产生。由口述命令调用的操作可以包括敲键盘、鼠标事件、运行外部命令或三者的任意结合。

Xvoice使用ViaVoice语音库来识别命令和常规文字。xvoice.xml配置文件可以对命令进行定义。Xvoice使用标准的配置文件,其位置是/usr/share/xvoice/xvoice.xml。当然用户也可以对其位置进行修改,例如可以改为 ~/.xvoice/xvoice.xml。

Xvoice的窗口可以显示哪一个命令语法是被击活的,并且窗口中还包括一个面板可以显示最近口述的命令。如果Xvoice认为用户口述的一些词语与某个命令十分相似难以识别,那么在面板中显示的这一命令将是灰色的,以便提醒用户,并且这条命令不会被执行。

对于任何应用程序窗口,Xvoice都有4种不同的状态。在命令模式下,Xvoice只对命令进行识别;在听写模式下,Xvoice不识别特定的应用程序命令,只是显示出它能识别的词语;在空闲模式下,只有一般命令可以被识别;最后,在命令和听写模式下,口述词语和命令都可以被识别,这时用户需要在命令的前后稍加停顿,以便与文本相区别。

当用户第一次运行某一应用程序时,Xvoice会自动启动命令模式。如果用户想同时打开听写模式,只需要说“听写模式”便可以了;如果想关闭听写模式,也只需要说“停止听写模式”就万事大吉了。

当然,最好的方法是将Xvoice窗口置于系统的窗口管理器中,这样你就可以随时了解它的工作情况了。如果你想在开机时便自动运行Xvoice,只要将xvoice m 放入窗口管理器的启动程序中就行了。

声控应用程序

下面来看一看如何为应用程序定义语法。首先,将要定义语法的软件定义为一个可读的名字,然后为程序的窗口命名一个语句,这样Xvoice便可以识别哪个语法命令是要激活的。在第一行,可以看到一个特殊的固定应用程序名,而它并不是窗口标题。这一特殊的应用程序名必须上下文统一。

应用程序的标签中包含有听写属性。如果条件为真,则首次运行语句时,Xvoice自动进入听写模式。语句的第二行包含有一些在< define name='numbers'>区中已经定义过的值。用户可以在定义区中自行定义标记,并应用于整个配置文件中。

语句的第3行举例说明定义区内可以包含的内容,而这里的命令标记只能在本命令范围内使用。这一行的主要作用是通过语音命令各自的箭头键将彼此互联系起来。当执行命令时,系统会将语音命令与相应的键盘命令对应起来。语音命令的识别转换过程从第4行语句开始。第4行到第8行都是与键盘操作相关的语句,与鼠标相关的语句在第9行到第15行,第16行到第22行是与其它应用程序相关的命令语句,第23行是结束行。

通过对个人配置文件的编辑,用户几乎可以自动完成过去需要键盘和鼠标才能完成的所有操作过程。许多普通应用软件的语法组,事先已经包含在缺省的配置文件中了,成为用户良好的范例。

语音识别的发展

Xvoice无法控制一些特殊的应用软件和一些主流游戏软件。对于一些诸如GIMP和Netscape软件来说,虽然Xvoice可以对其进行控制,但是由于此类软件需要大量的鼠标操作,用户会对用语音控制鼠标感到十分厌烦。

虽然语音识别软件对于大多数命令和一般的文本都可以正确地识别,但是在某些情况下,即使是一个微小的错误也是不允许。语音软件的使用者必须使自已的声音保持稳定。

另外,虽然XVoice 和ViaVoice可以完成大量的工作,但是用户却无法通过声音控制整个Linux桌面环境。

IBM公司已经发布了新的ViaVoice,但是只支持Mac 和Windows,未来是否能支持Linux目前尚不确定。Xvoice的开发人员们正在努力寻找一种能支持开放系统的替代产品,而不希望再为Xvoice增加新的功能了。

通过本文大家理解到了Linux上的语音识别,希望对大家有帮助。


相关内容