欢迎来到天天文库
浏览记录
ID:22412039
大小:329.50 KB
页数:9页
时间:2018-10-29
《昆明理工大学 人工智能 大作业》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、课程名称:人工智能论文题目:中文语音识别技术的最新研究进展学院:信息工程与自动化学院专业:计算机科学与技术年级:09级学生姓名:孙浩川(200910405310)指导教师:王剑教务处制8摘要本文简要介绍了语音识别技术的发展历史,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别在通信等领域中的应用。机器能听懂人类的语言吗?我们能扔掉键盘、鼠标用自然语言操纵计算机吗?随着语音识别技术的发展,梦想正在变为现实。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人
2、在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。简要介绍语音识别的发展历史,采用的关键技术,面临的困难与挑战以及广阔的应用前景。关键字:中文、语音识别、技术、发展8目录一、语音识别技术的发展历史31、国外的发展形势32、国内的发展3二、语音识别技术发展所面临的困难41、认识语音识别系统42、面临的困难43、解决困难的方法5三、语音识别技术的应用以及发展前景51、目前语音识别技术在许多领域的应用52、对语音识别技术的发展前景6四、结束语(结论)6谢辞7参考文献88一、语音识别技术的发展历史1、国外的发展形势首先,从国外的形势看来。语音识别的研究工作可
3、以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,他们把原本艰涩的HMM纯数学模型工程化,从而使统计方法成为了语音识别技术的主流,更多地从整体平均的角度来建立最佳的语音识别系统。人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用
4、化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。2、国内的发展看了国际的情况,现在看看我们国家的语音识别技术的发展情况。我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。8我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音
5、识别。由于当时条件的限制,我国的语音识别研究工作一直处于缓慢发展的阶段。进入80年代以后,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。1986年3月我国高科技发展863计划启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。从此我国的语音识别技术进入了一个前所未有的发展阶段。在非特定人语音识别方面:清华大学计算机科学与技术系在87年研制的声控电话查号系统并投入实际使用。在连续语音识别方面:91年12月四川大学计算机中心在微机上实现了一个主题受限的特定人连续英语——汉语语音翻译演示系统。在孤立字大词汇量
6、语音识别方面:最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统。一、语音识别技术发展所面临的困难1、认识语音识别系统首先介绍一下语音识别系统的分类方式及依据。根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统。根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。不同的语音识别系统,虽然
7、具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如下图所示。2、面临的困难8目前,语音识别技术还面临着许多的问题,还不够成熟,主要有:第一,语音识别的研究工作进展缓慢,主要表现在理论上一直没有突破。虽然各种新的修正方法不断涌现,但还缺乏普遍适用性。第二,语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题
此文档下载收益归作者所有