语音端点检测.doc

语音端点检测.doc

ID:56812887

大小:889.00 KB

页数:39页

时间:2020-07-12

语音端点检测.doc_第1页
语音端点检测.doc_第2页
语音端点检测.doc_第3页
语音端点检测.doc_第4页
语音端点检测.doc_第5页
资源描述:

《语音端点检测.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、目录摘要IAbstractII第1章绪论11.1课题背景11.2语音端点检测现状11.3相关工作31.4本文主要研究内容4第2章语音信号时频域分析及预处理52.1语音信号简述52.2语音信号分析52.2.1时域分析62.2.2频域分析62.3语音信号分析处理82.3.1预加重82.3.2加窗分帧92.4本章小结10第3章语音端点检测算法研究113.1语音端点检测113.1.1简述113.1.2语音端点检测原理113.1.3语音端点检测算法及实施方案133.2基于短时能量和短时过零率的语音端点检测143.2.1短时平均能

2、量153.2.2短时过零率173.2.3基于短时能量和短时过零率的双门限端点检测193.2.4双门限语音端点检测实验203.3基于倒谱特征的语音端点检测213.3.1倒谱特征213.3.2倒谱距离223.3.3倒谱距离的检测算法流程243.3.4基于倒谱特征的语音端点检测试验分析263.4基于谱熵的语音端点检测273.4.1谱熵特征273.4.2基于谱熵的端点检测流程283.4.4基于谱熵特征的语音端点检测试验分析293.5算法比较313.6本章小结34结论36参考文献37致谢38附录139附录244附录350附录45

3、7附录564第1章绪论1.1课题背景语音端点检测在语音识别中占有十分重要的地位。语音信号处理中的端点检测技术,是指从包含语音的一段信号中确定出语音信号的起始点及结束点。是进行其它语音信号处理(如语音识别、讲话人识别等)重要且关键的第一步。进行有效的端点检测能够对语音信号更好的进行分析和训练,这样语音识别才能有好的识别率[1]。实际运用中,通常要求首先对系统的输入信号进行判断,准确地找出语音信号的起始点和终止点。这样才能采集真正的语音数据,减少数据量和运算量,并减少处理时间。目前,语音技术正进入一个相对成熟点,很多厂商和

4、研究机构有了语音技术在输入和控制上令人鼓舞的演示,输入的硬件和软件平台环境也日益向理想化迈进,但语音技术比起人类的听觉能力来还相差甚远,其应用也才刚刚开始,进一步规范和建设语音输入的硬件通道、软件基本引擎和平台,使语音技术能集成到需要语音功能的大量软件中去。而且语音产业需要更加开放的环境,使有兴趣和实力的企业都能加入到这方面的研究和开发中,逐步改变。随着声控电子产品的不断研发,语音识别技术在开发和研究上还有大量的工作需要做。1.2语音端点检测现状作为一个完整的语音识别系统,其最终实现及使用的效果不仅仅限于识别的算法,许

5、多相关因素都直接影响着应用系统的成功与否。语音识别的对象是语音信号,端点检测的目的就是在复杂的应用环境下的信号流中分辨出语音信号和非语音信号,并确定语音信号的开始及结束。一般的信号流都存在一定的背景声,而语音识别的模型都是基于语音信号训练的,语音信号和语音模型进行模式匹配才有意义。因此从信号流中检测出语音信号是语音识别的必要的预处理过程[2]。在识别系统中,语音端点检测可以大量减少信号传输量及识别器的运算负载,对于语音对话的实时识别有重要作用。对非语音信号的识别不仅是一种资源浪费,而且有可能改变对话的状态,造成对用户的

6、困扰。在需要打断(barge-in)功能的系统中,语音的起始点是必须的。在端点检测找到语音的起始点时,系统将停止提示音的播放。完成打断功能。随着语音识别应用的发展,越来越多系统将打断功能作为一种方便有效的应用模式,而打断功能又直接依赖端点检测。端点检测对打断功能的影响发生在判断语音/非语音的过程出现错误时。表现在过于敏感的端点检测产生的语音信号的误警将产生错误的打断。例如,提示音被很强的背景噪音或其它人的讲话打断,是因为端点检测错误的将这些信号作为有效语音信号造成的。反之,如果端点检测漏过了事实上的语音部分,而没有检测

7、到语音。系统会表现出没有反应,在用户讲话时还在播放提示音。语音技术的应用己经成为一个具有竞争性的高新技术产业,它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理,工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。语音处理内容涉及到计算机科学、模式识别、信号处理、生理学、语音学、心理学等学科,还涉及到信号和信息处理系统、通信和电子系统等具体应用领域。多媒体技术的发展,使语音技术逐渐

8、在越来越多的场合中推广使用,语音信号处理技术发展迅速,其研究成果具有重要的学术及应用价值,涉及一系列前沿课题。语音信号处理与信息科学中最活跃的前沿科学密切联系,并且共同发展。例如,神经网络理论、模糊集理论、小波理论是当前热门的研究领域,这些领域的研究常常把语音处理任务作为一个应用实例,而语音处理研究者也从这些领域的研究进展中找到突

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。