一种基于能量聚类分析的句子语音端点检测法new

ID：34409430

大小：172.68 KB

页数：3页

时间：2019-03-05

资源描述：

《一种基于能量聚类分析的句子语音端点检测法new》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、维普资讯http://www.cqvip.com第8卷年第骨月期计算机技术与发展Vo1．L8NO．42008年4(DMP1厂rERTECKNOLOGYANDDEVELOPMENTApr．2008一种基于能量聚类分析的句子语音端点检测法罗世谦，冯子亮，张恒(四川大学计算机学院，四川成都610064)摘要：针对语音复读系统等背景噪声相对较小且稳定的实际应用环境，提出一种改进的基于时域分析的句子语音端点检测算法。因为在此类应用环境中，对句子语音端点检测的干扰因素较少，且一般需要实现快速的句子语音端点检测。因

2、此，简化了所要使用的语音特征参数，不再使用时域分析中常用的过零率，仅使用语音信号能量特征值辅以聚类分析完成语音端点检测。实验表明，本算法简化了端点检测的过程，可以便捷有效地检测出句子中的语音端点。关键词：句子语音端点检测；能量特征；聚类分析中图分类号：TN912．34文献标识码：A文章编号：1673—629X(2008)04—0013—03ASententialEndpointDetectionAlgorithmBasedonEnergyEigenvalueandClusteringAnalysisL

3、UOShi．qian，FENGZi·liang，ZHANGHeng(CollegeofComputerScience，SichuanUniversity，Chengdu610064，China)Abstract：Toactualapplicationsystemoflownoise，suchasvoicereplayer，animprovedsententialendpointdetection~gofithmbasedontimedomainanalysiswasdiscuss"edinthispa

4、per．Becauseoflessdisturbedinspectsinthisapplicationenvironment，andneedingrealizefastspeedendpointdetectionofsentences，simplifytheparametersofvoicecharacteranddonotusec—zerorate．Byusingspeechan-ergyeigenvalueandclusteringanalysis。theendpointofsentencesca

5、nbedetectedveryrapidly．Experimentsshowthatthealgorithmcansimplifytheprocessofsententialendpointdetectionandhaveexcellentperformance．Keywords：endpointdetectionofsentenc~；energy'eigenvMue；clusteringanalysisO引言1句子语音端点检测处理在语音复读系统以及语音识别系统中，句子的语1．1全部语音端点检测音端点

6、检测非常关键。传统的基于时域分析l_1．2J的语通过对语音帧的能量特征值的计算，实现包括单音端点检测算法需要考虑短时线性能量、短时对数能词端点和句子端点在内的全部语音端点检测。具体处量、短时过零率等多种语音特征值l3．4]，并通过门限判理包括快速分帧、归一化处理帧、帧能量计算等过程。断句子的端点，在大多数情况下可以获得较好的效果，(1)快速分帧：传统的分帧算法l4．5J取连续N个语但存在检测速度慢、效率不高等问题。在一些使用环音信号作为一帧，如对lOldqz的样本频率，典型的帧尺境相对简单，背景噪声相

7、对较小且稳定的情况中，需要寸为l0到20ms，即N=100至200，为了保证特征矢实现快速的句子语音端点检测。量系数的平滑，帧与帧之间有部分样本重叠使用，比如针对背景噪声相对较小且稳定的实际应用环境，重叠2／3帧，但这样会导致算法复杂度增大，而且必须在基于时域分析的语音端点检测算法基础上，提出基使用特定窗函数对数据进行处理。文中将对上述过程于能量特征和聚类分析的检测算法。仅使用能量特征进行了简化改进，在语音帧分帧时不用重叠，也不用复一个特征值，通过对所有语音端点间隙值的聚类分析杂的窗函数进行加窗处理，

8、而是直接采用最基本的矩得到句子端点，不仅可以简化端点检测过程，而且对不形窗对语音信号进行分段。鉴于分的段大小不能跨过同语速语音材料有较好的适应性。语音间隙，且所包含部分若丢弃不会对语音播放效果造成影响，所以切取0．1秒语音信号大小为一帧(即一收稿日期：2007—07一l1段)来进行分段。基金项目：国家863计划资助项目(2006AA12A104)作者简介：罗世谦(1984一)，男，四川人，硕士研究生，研究方向为实(2)归一化处理帧(每帧中样本值的预处理)

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 / 3



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

一种基于能量聚类分析的句子语音端点检测法new

一种基于能量聚类分析的句子语音端点检测法new

相关文章

相关标签