基于矢量量化的语音识别与全文检索.研究

基于矢量量化的语音识别与全文检索.研究

ID:31981342

大小:3.68 MB

页数:69页

时间:2019-01-30

基于矢量量化的语音识别与全文检索.研究_第1页
基于矢量量化的语音识别与全文检索.研究_第2页
基于矢量量化的语音识别与全文检索.研究_第3页
基于矢量量化的语音识别与全文检索.研究_第4页
基于矢量量化的语音识别与全文检索.研究_第5页
资源描述:

《基于矢量量化的语音识别与全文检索.研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1绪论语音是语占的声学表现,是人类交流信息最自然、最有效、最方便的手段。人类进入信息化时代开始用现代科技研究语音处理技术,这使人们能更加有效地产生、传输、存储和获取语言信息。人们可以应用自动语音识别技术,使手写文稿和手工打印文本转为自动听写机操作,还可以把人工查阅各种书面文字资料的操作转为口呼自动查阅各种各样的数据库。这就是说,如果人的听、说、读、写、查阅信息和语音通信等行为,都能采用先进的技术高效率地完成,必将使人的才能得到更加充分的发挥和有效的扩展。语音信号处理中的语音识别技术是一门涉及面很广的交叉学科,虽然从事这一领域研究的人员主要来自计算机和通信等学科,但是它与语音学、语言学

2、、数理统计学以及神经生理学等学科,也有着非常密切的关系,甚至还涉及到人的体态语言。语音识别的最终目标是实现人与机器进行自然语言通信。众所周知,语音是人类进行相互通信和交流最方便、最快捷的手段,它的传播速度特别快,可以达到毫秒量级,没有严格的方向限制,还可以在黑暗中传播。在高速发展的信息社会中,用数字化的方法进行语音传送、储存、识别、合成、增强等,将对促进社会发展具有十分重要的意义。计算机的高速发展既对语音识别技术提出了越来越高的要求(用语音输入代替键盘输入,以实现直接的人机对话),同时也提供了高效率的软、硬件实现手段。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条

3、件下获得满意的性能,或者说只能应用于某些特定的场合。1.1语音识别的发展和现状语音处理技术主要分为语音识别,自然语言理解和文语转换三个部分。语音识别将人的语音转化成为本,是计算机能够听懂人的语言,辨明语音的内容或者说话人,将人的语音正确转化为书面语言或者有意义的符号;自然语言理解是使计算机将文本命令等转换为真实的指令并加以执行,文语转换则根据文本合成语音输出,用于实现人机对话,因此语音识别在语音应用系统中属于前端处理部分⋯【2】o语音识别技术的发展始于20世纪50年代。70年代之前,语音识别的研究特点是以孤立词的识别为主。70年代起,人工智能技术开始被引入到语音识别中来,语音识别研究

4、取得了诸多的成就,首推DTW算法,DTW算法是把时间归正和距离测度计算结合起来的一种非线形归正技术。这是语音识别中一种非常成功的匹重庆人学硕士学位论文配算法,在小词汇量的研究中获得了成功。70年代80末年代初,矢量量化码本生成的方法被成功地应用的语音领域中。从此矢量化技术(VQ)发挥了重要的作用。20世纪80年代开始,语音识别研究的一个重要进展,就是识别算法从模式匹配技术转向基于统计模型的技术,更多地追求从整体统计的角度来建立最佳的语音识别系统。隐马尔可夫模型(HMM)技术就是其中最典型的技术。直到目前为止,HMM方法,VQ方法仍然是语音识别研究中的主流方法。80年代后期开始,人工神

5、经网络(ANN)、支持向量机(SVM)、进化计算(EC)等技术也被应用到语音识别领域,在模型设计细化、参数提取和优化以及系统的自适应技术等方面取得了一些关键性的进展。我国语音识别研究工作起步于五十年代,清华大学,中科院自动化所,声学所成为国内语音学研究的中心,863连续语音数据库的设立为各研究机构提供了同意的训练,测试平台。此外,台湾清华大学,香港中文大学,香港科技大学和一些其他国家和机构的研究人员也在汉语识别领域取得了很多成果。目前中文语音识别技术还未成熟,将中文特有的知识表达方式和世界先进的研究经验进行结合,是中文语音识别的研究方向。现在语音识别技术的热点主要集中几个领域:·小型

6、移动设备/客户机一服务器构架下的识别策略●多模型语音识别●适应环境的健壮性合资适应性·结合生理学知识的特征采集和模型构造●自然语言现象●语音,语言,音调,重音等多信息源在语音识别和语意理解中的融合1.2语音搜索引擎的发展与现状随着计算机技术的迅猛发展,人类社会已步入高度自动化信息化的时代。可以说计算机技术的发展大大加快了人类社会的进步。而人类社会的进步反过来对计算机技术的发展提出了更高的要求和挑战。而今,对于语音识别技术与搜索引擎技术的发展与社会需求造就了最近几年语音搜索领域的快速发展。1.2.1国外语音搜索引擎的发展现状搜索巨头Google公司早已对这其中蕴藏的巨大商机虎视眈眈,已

7、经着手研究这项新技术并申请了专利,并且在美国开通了电话语音搜索服务。从Google语音搜索来看,其实是跟本地搜索相结合的,其数据库中的信息都来自GoogleMap的本地商户信息。通过语音搜索,可以通过电话或手机短信快速得到本地商家的信息,包括电话号码、详细地址等。使用的大致步骤如下:21绪论首先拨打免费电话1—800.GOOG一411(即1-800.466.4411)接通Google服务器,之后Google要求你告知搜索目标所在的州和城市名,确认之后,然后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。