+?>@ABCD+>CDED+>!"$$&+72:)@7KL)C98)""""""""""> +?>@ABCD+>CDED+>!"$$&+72:)@7KL)C98)"""""""""" />
汉语自然口语中声调识别的研究 !.pdf

汉语自然口语中声调识别的研究 !.pdf

ID:52993841

大小:183.25 KB

页数:6页

时间:2020-04-07

汉语自然口语中声调识别的研究 !.pdf_第1页
汉语自然口语中声调识别的研究 !.pdf_第2页
汉语自然口语中声调识别的研究 !.pdf_第3页
汉语自然口语中声调识别的研究 !.pdf_第4页
汉语自然口语中声调识别的研究 !.pdf_第5页
资源描述:

《汉语自然口语中声调识别的研究 !.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第-(卷第!"期"$$&年!"月物理学报F93)-(,E9)!",GH8H0IHJ,"$$&!$$$/’"<$="$$&=-((!")=&$(*/$(>+?>@ABCD+>CDED+>!"$$&+72:)@7KL)C98)"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""汉语自然口语中声调识别的研究!!)")#")")")")!)刘赵杰邵健张鹏远赵庆卫颜永红冯稷!)(中国科学院物理研究所,北京!$$$%$)")(中国科学院声学研究所,北京!$$$%$)("$$&年’月(日收到;"$$&年(月!日收到修改稿)汉语是一

2、种带声调的语言,声调信息在汉语识别中具有非常重要的意义)传统的声调识别一般只研究朗读式语音中相对标准的声调,很少对声调调型比较复杂的自然口语进行专门的处理)针对汉语自然口语的特点,在声调建模单元的选择时提出了真实上下文的模型)同时,为了对声调模式进行精细建模,采用了一种层次聚类的方法来获得更多的声调模式)实验结果证明了方法的有效性)关键词:声调识别,自然口语,真实上下文模型,聚类!"##:*’&$+,%&’(字组、四字组声调模式进行了研究,给出了一些定性!;引言的分析结果;文献[’]采用定性分析总结出应用声调识别的"’种模式)由于语音数据变化随机性很大,声调是汉语音节中的三要素之一,人们不

3、仅要这些方法往往只重视对少量语音数据特例的分析,凭借不同的声母、韵母来辨别字和词的意义,还需要很难反映比较全面的声调变化规律)而后者主要是以不同的声调来区别它们)如果将音节与声调分开通过从训练语料中统计出声调模式的变化规律,然考虑,汉语的!’$$多个带调的音节可以减少到*$$后对其进行定量描述)如文献[*]利用聚类分析提取多个无调音节,这对于简化识别的模型和搜索的空句子中音节的基频模式;文献[-]利用决策树的数据间是很有益处的)在现代汉语普通话中通常把声调驱动方法从大规模语料中统计出连续语音中声调可分成五种:一声(阴平)、二声(阳平)、三声(上声)、四能的模式分布)由于语音数据的复杂性,只

4、有数据驱声(去声)和轻声,不同的声调对应着不同的基频变动和知识驱动结合起来才能够对声调模式进行描述)化曲线)轻声只有在两个音节以上的连续语音中才目前连续语音识别的趋势是从朗读式语音识别会出现,而且轨迹曲线比较短,接近于四声,但形状到自然口语语音识别)相对于朗读式语音而言,自然很不稳定且变化较大,所以本文的研究中没有考虑口语是人类相互交流的一种最为直接、最为自然的轻声)方式,在声学层面上往往包含了多变的语速、真实的在汉语连续语音识别系统中,如果能获得准确情绪和严重的协同发音现象等)由于自然口语的上的声调信息将会有效地提高识别系统的性能)多年述特点会使声调基频轨迹曲线的模式变得更加复来,许多学

5、者在声调识别方面进行了大量的研究分杂,准确地分析和把握这些变化的规律对于正确识析,在孤立词和朗读式语音中取得了很多研究成别自然口语具有重要意义)而前人的研究很少涉及[!—!$][!!]果)在研究方法上主要分为两种,基于规则的知这个方向,因此本文主要对自然口语中的声调识识驱动和基于统计的数据驱动)前者主要是通过手别进行了初步探索)工分析以及定性观察来获得声调的定性描述,比如以文献[!"]混合高斯模型为基础,根据自然口文献[!]对二字词中可能出现的声调模式变化作了语中声调的特点,本文在声调建模单元选择时提出研究分析和定性描述;文献["]对汉语的二字组、三了一种真实上下文的模型)然后用一种聚类的

6、方法!国家重点基础研究发展规划(批准号:"$$*+,’!%!$()和国家自然科学基金(批准号:!$-&*!*$,($-’-$’$)资助的课题)#./0123:432567883)291)18)8:75期刘赵杰等:汉语自然口语中声调识别的研究@’?>以获得更为精细的声调模型!基于香港科技大学所能反映声调的不同,但是在连续语音尤其是自然口采集的"#$%&’(电话语音数据和中国社会科学院语语中,它们的作用就不是很明显!在声调识别特征选言研究所提供的汉语自然口语库()*%&+,+-&&./$/+0取时,一般都是基于基频的轮廓信息,在本文的分析12.&/$&+.3,12++4*).#23,,简称)-

7、11)的实验结果证中主要用基频和它的一阶差分信息!声调的信息主明了所用方法的有效性!要反映在音节浊化部分的基频曲线上,而音节的浊化部分一般都集中在音节的韵母部分和部分声母56声调特征与声调模型上!在声调研究中为了方便声调特征的提取和声调模型的集成,本文只取韵母部分的基频曲线信息作基频是汉语声调最主要的特征之一,基频变化为声调特征!图7是训练数据中一个男声样本的基的不同轨迹也就是所谓的声调!能量和浊化程度也频曲线图!图7自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。