一种基于能量聚类分析的句子语音端点检测法new

一种基于能量聚类分析的句子语音端点检测法new

ID:34409430

大小:172.68 KB

页数:3页

时间:2019-03-05

一种基于能量聚类分析的句子语音端点检测法new_第1页
一种基于能量聚类分析的句子语音端点检测法new_第2页
一种基于能量聚类分析的句子语音端点检测法new_第3页
资源描述:

《一种基于能量聚类分析的句子语音端点检测法new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、维普资讯http://www.cqvip.com第8卷年第骨月期计算机技术与发展Vo1.L8NO.42008年4(DMP1厂rERTECKNOLOGYANDDEVELOPMENTApr.2008一种基于能量聚类分析的句子语音端点检测法罗世谦,冯子亮,张恒(四川大学计算机学院,四川成都610064)摘要:针对语音复读系统等背景噪声相对较小且稳定的实际应用环境,提出一种改进的基于时域分析的句子语音端点检测算法。因为在此类应用环境中,对句子语音端点检测的干扰因素较少,且一般需要实现快速的句子语音端点检测。因

2、此,简化了所要使用的语音特征参数,不再使用时域分析中常用的过零率,仅使用语音信号能量特征值辅以聚类分析完成语音端点检测。实验表明,本算法简化了端点检测的过程,可以便捷有效地检测出句子中的语音端点。关键词:句子语音端点检测;能量特征;聚类分析中图分类号:TN912.34文献标识码:A文章编号:1673—629X(2008)04—0013—03ASententialEndpointDetectionAlgorithmBasedonEnergyEigenvalueandClusteringAnalysisL

3、UOShi.qian,FENGZi·liang,ZHANGHeng(CollegeofComputerScience,SichuanUniversity,Chengdu610064,China)Abstract:Toactualapplicationsystemoflownoise,suchasvoicereplayer,animprovedsententialendpointdetection~gofithmbasedontimedomainanalysiswasdiscuss"edinthispa

4、per.Becauseoflessdisturbedinspectsinthisapplicationenvironment,andneedingrealizefastspeedendpointdetectionofsentences,simplifytheparametersofvoicecharacteranddonotusec—zerorate.Byusingspeechan-ergyeigenvalueandclusteringanalysis。theendpointofsentencesca

5、nbedetectedveryrapidly.Experimentsshowthatthealgorithmcansimplifytheprocessofsententialendpointdetectionandhaveexcellentperformance.Keywords:endpointdetectionofsentenc~;energy'eigenvMue;clusteringanalysisO引言1句子语音端点检测处理在语音复读系统以及语音识别系统中,句子的语1.1全部语音端点检测音端点

6、检测非常关键。传统的基于时域分析l_1.2J的语通过对语音帧的能量特征值的计算,实现包括单音端点检测算法需要考虑短时线性能量、短时对数能词端点和句子端点在内的全部语音端点检测。具体处量、短时过零率等多种语音特征值l3.4],并通过门限判理包括快速分帧、归一化处理帧、帧能量计算等过程。断句子的端点,在大多数情况下可以获得较好的效果,(1)快速分帧:传统的分帧算法l4.5J取连续N个语但存在检测速度慢、效率不高等问题。在一些使用环音信号作为一帧,如对lOldqz的样本频率,典型的帧尺境相对简单,背景噪声相

7、对较小且稳定的情况中,需要寸为l0到20ms,即N=100至200,为了保证特征矢实现快速的句子语音端点检测。量系数的平滑,帧与帧之间有部分样本重叠使用,比如针对背景噪声相对较小且稳定的实际应用环境,重叠2/3帧,但这样会导致算法复杂度增大,而且必须在基于时域分析的语音端点检测算法基础上,提出基使用特定窗函数对数据进行处理。文中将对上述过程于能量特征和聚类分析的检测算法。仅使用能量特征进行了简化改进,在语音帧分帧时不用重叠,也不用复一个特征值,通过对所有语音端点间隙值的聚类分析杂的窗函数进行加窗处理,

8、而是直接采用最基本的矩得到句子端点,不仅可以简化端点检测过程,而且对不形窗对语音信号进行分段。鉴于分的段大小不能跨过同语速语音材料有较好的适应性。语音间隙,且所包含部分若丢弃不会对语音播放效果造成影响,所以切取0.1秒语音信号大小为一帧(即一收稿日期:2007—07一l1段)来进行分段。基金项目:国家863计划资助项目(2006AA12A104)作者简介:罗世谦(1984一),男,四川人,硕士研究生,研究方向为实(2)归一化处理帧(每帧中样本值的预处理)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。