基于主动学习汉语韵律短语预测的研究

基于主动学习汉语韵律短语预测的研究

ID:34578103

大小:8.89 MB

页数:43页

时间:2019-03-08

基于主动学习汉语韵律短语预测的研究_第1页
基于主动学习汉语韵律短语预测的研究_第2页
基于主动学习汉语韵律短语预测的研究_第3页
基于主动学习汉语韵律短语预测的研究_第4页
基于主动学习汉语韵律短语预测的研究_第5页
资源描述:

《基于主动学习汉语韵律短语预测的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、天津师范大学硕士学位论文摘要随着计算机智能化的飞速发展,语音合成技术越来越广泛的应用到人们的生活中。提高语音合成的自然度是语音合成技术的一个重要发展方向,而韵律结构预测的准确度不高,是提高合成语音自然度的一大障碍。本文调研了汉语韵律结构预测研究的历史和现状,分析并总结了目前汉语韵律结构预测采用的相关技术。与其他各种机器学习问题类似,汉语韵律短语的预测也需要一定数量的已标注数据用作训练数据,这就需要大量的时间和人力放在韵律短语的标注上,这也是传统分类算法所共有的问题。对此,近年来产生了一种新的思路,就是通过综合使用已标注数据和未标注

2、数据,联合进行训练,以弥补标注数据不足所带来的影响,从而可以大大降低人工标注工作量。半监督学习、主动学习等方法,都是由此思路而产生的。基于此,本文将基于条件随机场模型的主动学习方法用于汉语韵律短语预测,并实现了一个汉语韵律短语边界预测及标注的原型系统。本文实现的汉语韵律短语边界标注及预测的原型系统采用人机交互的方式,基于部分标注的训练集由计算机选出最佳样例由人工进行标注,进而更新已标注的训练集,依此迭代直到训练出令用户满意的模型。此外,本文通过实验对比证明应用该方法可以较好地解决汉语韵律短语预测和标注的主动学习问题,在降低人工工作

3、量,利用部分已标注数据的基础上,仍能较好地达到汉语韵律短语边界预测的目的。关键词:汉语韵律短语,条件随机场模型,主动学习天津师范大学硕士学位论文AbstractWiththerapiddevelopmentofcomputerintelligence,speechsynthesistechnologybecomesmorewidelyappliedtopeople'slives.Speechsynthesisnaturalnessisanimportantdirectionofdevelopmentofspeechsynthesi

4、stechnology,andtheaccuracyoftheprosodystructurepredictionisnothigh,whichisamajorobstacletoimprovethenaturalnessofsyntheticspeech.BasedonthehistoryandcurrentresearchsituationoftheChineseprosodicstructureprediction,thispapersummarizesandanalyzesthecurrenttechnologyusedi

5、nChineseprosodicstructureprediction.Similartoothermachinelearningmethods,thepredictionofChineseprosodicphraserequiresacertainamountoflabeleddataastrainingdata,sothatyouneedtospendalotoftimeandmanpoweronthelabelingofprosodicphrase,andthisisthecommonproblemstotraditiona

6、lclassificationalgorithms.Inrecentyears,thereisanewmethodwhichintegratesthelabeleddataandtheunlabeleddatawhentrainingdata,toovercomethelackoflabeleddataandtogreatlyreducetheworkloadofthemanuallabeling.Semi-supervisedlearningmethodandactivelearningmethodwerebothgenerat

7、edbasedonthisidea.Inthispaper,theauthorusesanactivelearningmethodbasedonCRFsandrealizesaprototypesystemforthepredictionandannotationofChineseprosodicphraseboundaries.Theprototypesysteminthispaperuseshuman-computerinteraction,beginningwithpartiallabeledtrainingdata,mak

8、ingthecomputerselectthebestsampletoasktheannotatortolabelandupdatetheinitialtrainingset.Experimentsontheactivelearningmethod

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。