IBMViaVoice语音识别系统
IBM旗下语音识别系统
IBM ViaVoice是IBM公司开发的高性能的语音识别系统。它由语音板、口音适应程序、IBM ViaVoice属性、麦克风设置向导程序、词汇管理器及联机参考手册等6个部分组成。 ViaVoice的基本用法虽然不是太难,但是在安装之后还不能立即使用,因为这时计算机还不“认识”你,只有在通过口音适应程序建立针对你个人口音特点的模型后,才能有效地使用。 IBM ViaVoice在标称功能上有以下几个主要特点:连续语音识别、具有强大的学习功能、每分钟平均150个字、输入最高识别率达95%,平均识别率达85%
使用技巧
设置麦克风
在你开始使用ViaVoice之前,必须使麦克风能正常工作。ViaVoice的麦克风设置向导程序将引导你正确设置麦克风。步骤如下:
1.启动麦克风设置。如果运行过麦克风设置向导程序,你可以单击“调节音量”,直接进行麦克风音量调节和语音识别测试。如没有运行过设置向导程序,则单击“设置头戴式麦克风”,单击“下一步”;
2.麦克风设置向导程序将检测计算机并显示出它找到的混音器设备。如果它不认识这个混音器设备,将显示“末知”。如果有外部扬声器,并且所处的环境下放出的音响不会干扰他人,你可以选择外部扬声器。单击“下一步”;
3.单击“测试”按钮,如果音频设置正确,你将听到音乐,并可以用鼠标拖动“音量”按钮调节至最佳听觉效果。如果听不到声音,可以单击“帮助”按钮获得解决办法。单击“下一步”;
4.如果使用头戴式麦克风,请按窗口中图片所示配戴,定位麦克风使其从脸部伸出大约2厘米左右,稍偏嘴边,以防呼吸影响。单击“下一步”;
5.在前面正确安装并测试耳机或外部扬声器之后,此时就可以安装和设置麦克风了。首先,将麦克风插头插到声卡上的麦克风插孔中,确定其被正确地插到麦克风插孔中。其次,如果你的麦克风有“on/off”开关,确定其置于“on”。最后,单击“测试”(或“重测”)按钮,并朗读句子“正在测试麦克风设置”来测试麦克风。如果计算机测到麦克风已经连接正确,向导程序将告诉你的麦克风已设置成功并被正确地连接到计算机上,单击“下一步”;
6.向导程序将提示你麦克风已设置成功。单击“下一步”以调节音量并测试使用此麦克风的识别效果。至此,麦克风的安装设置已经完成。
注意:如果你没有选择麦克风使用的每一个适配器,麦克风设置向导程序可能不会正确设置好你的麦克风。如果要选择其他适配器,单击“上一步”直到进入信息收集窗口。选择麦克风使用的每一个适配器。
语音设置
在对麦克风进行正确的安装和配置后,还必须耐心地进行语音设置,否则麦克风不能工作。
系统提供一组词组要求我们朗读,语音识别核心根据我们的读音,自动调节麦克风音量和识别核心,以适应我们的声音。这不仅是使用语音系统必须要进行的一个设置过程,而且在语音系统的使用过程中,可能还会经常用到。如果对音量的调整不恰当,对ViaVoice的识别率将有很大的影响,所以我们尽量调节音量到一个合适程度。当系统配置发生变化时,还需要重新调整。
进行音量调节时,首先进入音量调节窗口,单击开始按钮后,随着指示框(蓝框)的移动读出当前高亮显示的词。用正常语音,请勿高声、低语,或逐词变换语调,词与词之间要保持一定间隔。每读一个词不能多于3秒钟。读完一个词后,请保持安静,直到指示框移到下一词。当蓝色框长时间停止不动时,会出现提示信息,说明麦克风检测不到声音,请重新检查麦克风设置。麦克风检测不到声音的原因可能是:1.如果你的麦克风有on/off或on/mute开关,确定其置于on(开);2.确定你对着麦克风念所指示的词;3.如果你的麦克风使用电池适配器,检查电池是否有电;4.确定头戴式麦克风设置正确。如果不能确定,请运行麦克风设置向导程序;
当音量调节完成后,就进入语音识别测试阶段,单击“开始”按钮进行麦克风测试。在某些时候,当读完一个词后,它变为红色显示时,表示这个词的读音未被识别,可能原因是:1.麦克风未置于正确位置;2.在词间没有停顿;3.你对某些词的发音不符合ViaVoice要求;4.你念错了某词;5.你的音量必须处于绿色区域;6.环境噪音过大。
单击“停止”按钮,重新开始测试,直到正确读出每一个词后,语音测试完毕。
口音适应
ViaVoice的软硬件都已经装配好后,计算机还不能立即听懂或者完全理解你的话,你必须象教小孩子说话一样培养它。这项工作是由语音适应来完成的。
口音适应分为两部分:1.用户对一组给定的句子进行录音;2.ViaVoice进行口音训练生成语音文件。
首先让我们打开语音适应窗口。当你第一次进入口音适应窗口时,单击“新建”按钮创建一个“第一次适应”的新口音适应模板,系统会弹出一个口音适应描述对话框,请输入口音适应描述字符串,它将标志以后生成的语音模型文件。然后单击“开始”按钮就可以开始录音了。
如果你在此前已经进行过口音适应,口音适应窗口将列出你“已训练”、“已录音”、 “待录音”的语句数目,你可以选择上次的训练继续进行。
在进行口音适应之前,通过设置口音适应属性,可以简化操作,单击口音适应窗口左下角的“选项”按钮,系统将弹出图9所示的窗口,复选“自动切换到下一句”后,如果录完当前语句且该句子没有变红(表示录音通过),口音适应窗口将自动显示出下一条语句。“显示拒识信息”指示打开或关闭一个报告窗口。当完成一条语句的录音且该句子变红时,会出现一个窗口报告拒识信息,如果没有复选此框,则不会出现此窗口。复选“自动开始对下一句录音”后,完成一条语句的录音时,下一句的录音将自动进行,如果这个复选框没有被选中,你必须单击“开始”以切换到下一句。滑动“词/音匹配”按钮。可以改变对所念的词的识别匹配度。
当设置好口音适应选项后,单击“确定”,再直接单击“开始”进行口音录入,如果是首次录音,系统将弹出提示至少训练50句,单击“确定”进入训练窗口。
在进入口音适应训练窗口后单击“开始”,我们就正式开始口音适应了。对其显示出的句子以样例所示方式进行录音,标点符号也要读出,尽量使你的音量处于音量条的绿色区域内,当此语句变绿被识别通过时,继续下一句的录音,如果此语句未被识别时,该语句将变红,你需要重新录入,直到通过。
某词变红未被识别的原因主要有:1.麦克风未置于正确位置;2.在词间没有停顿;3.某些词发音不符合ViaVoice要求或你念错了某词;4.你的音量必须处于绿色区域里。
在WORD中听写
启动WORD听写可谓相当方便。我们可以对准麦克风念“听写到WORD”或从屏幕右下角的图标中启动程序。在WORD里,我们会发现在工具栏上多了一个“听写”菜单。在听写时,发音要清楚,语速要正常,并且念出所有的标点和排版符号。
限于各方面的原因,ViaVoice还不能100%识别你的口音,所以完成一段文字的录入后,往往需要校对,可按如下步骤进行:1.对准麦克风念“停止听写”,然后人工校对文本;2.当找到一个错误的词语或短语时,用鼠标加亮后双击,会出现纠错菜单;3.在纠错窗口双击要修改的词,会出现一个可供选择的下拉式菜单,从中选择正确的即可;4.纠错完成后将正文保存。
ViaVoice词汇管理器
ViaVoice词汇管理器是对在个人进行听写、录入产生错误词汇时添加到个人词汇表中的词汇进行管理的工具。当你下次碰到同样的词时,计算机能自动识别,这将大大减少你的工作量。经常对词汇表进行维护,是一个良好的习惯,你还可以用你的方言添加词汇,让你的计算机成为你亲切的“老乡”。
通过词汇表管理器,你可以查看加入到词汇表中的所有词汇,并对其进行编辑。
获得奖项
2000年在美国举行的苹果全球开发商会议(Apple'sWorldwideDevelopersConference)上,苹果设计大奖赛主办者祝贺开发商们创建出简单而易用的Mac操作系统的辉煌业绩。IBMViaVoice世纪1.0版被纽约时报选为2000年最受欢迎的十大顶尖商务软件之一,并两次被该报列入杰出商务软件的推荐名单之中。
参考资料
最新修订时间:2023-06-01 12:47
目录
概述
使用技巧
参考资料