基于条件随机场的傣语分词方法研究.pdf

基于条件随机场的傣语分词方法研究.pdf

ID:50322537

大小:4.56 MB

页数:54页

时间:2020-03-05

基于条件随机场的傣语分词方法研究.pdf_第1页
基于条件随机场的傣语分词方法研究.pdf_第2页
基于条件随机场的傣语分词方法研究.pdf_第3页
基于条件随机场的傣语分词方法研究.pdf_第4页
基于条件随机场的傣语分词方法研究.pdf_第5页
资源描述:

《基于条件随机场的傣语分词方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级公开编号學碛士呵究被嗲像怜夂题目基于条件随机场的僂语分词方法研究学院(所、中心)信息学院专业名称电子与通信工程研究生姓名张云学号导师姓名杨鉴职称教授年月论文独创性声明及使用授权本论文是作者在导师指导下取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研宄成果,不存在剽窃或抄袭行为。与作者一同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明并表示了谢意。现就论文的使用对云南大学授权如下:学校有权保留本论文(含电子版),也可以釆用影印、缩印或其他复制手段保存论文;学校有权公布论文的全部或部分内容,可以将论文用于查阅或借阅服务;学校有权向有

2、关机构送交学位论文用于学术规范审查、社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。内部或保密的论文在解密后应遵循此规定)研究生签名:导师签名:遠日期:摘要摘要分词技术是语音合成系统中前端文本分析中的一项重要环节,通过对语料文本的分词可以使合成出来的语音有更好的自然度,而自然度是指系统合成出来的语音是否符合人们的发音规则,听起来很流畅。大部分印欧语系的词和词之间存在自然分界符,这样就可以很方便的分辨出词边界,而在傣语文本中,并不存在这样的自然分界符,所以想要从一大段的傣语文本中划分出词边界,就是本文所要讨论的分词问题的由来。现在已经拥有的分词方法有很多,但是归纳

3、起来,主要有两种:机械分词和基于统计学的分词。机械分词的正确率相对较低,分词速度也依赖于词典的规模,效果不是很理想。因此,釆用统计学方法实现傣语分词成为值得深入研究的问题。本文采用条件随机场模型研宄傣语分词方法。主要完成了以下工作:、阐述了分词在语音合成中的作用,并参照中、英文分词方法对目前常用的两大类分词方法,即机械分词方法和基于统计学模型的分词方法进行了介绍。、通过对比介绍种常见的统计学的模型:隐马尔可夫模型(、最大熵马尔可夫模型(、条件随机场模型(,阐述了条机随机场模型用于傣语标记和分词上的优势。、以傣语声韵母作为特征项,对傣语字符进行了归纳,构建了傣语词典,并编写了程序对特征项和位置

4、信息进行了初步标记。、在平台上实现了傣语的训练和预测分词,并结合了动态链接库将分词算法移植到了平台,并给出实验结果。实验结果表明:使用条件随机场模型对傣语文本进行分词有较高的准确率,并且在精确度方面,我们的准确率为,召回率为值为可以满足傣语分词的基本要求,能够使得合成出的语音有较好的自然度。关键字:语音合成;分词;条件随机场模型;特征项选择AbstractAbstractSegmentationtechniqueisanimportantroundoffront-endtextanalysisinspeechsynthesissystem,,,,,,,,AbstractStudio2010p

5、latform,andgivingtheresult.Theresultoftheexperimentshowsthat,,,目录目录摘要第一章绪论弓胃什么是语音合成分词在语音合成系统中的作用分词的目的语音合成的研宄现状分词方法概述机械分词法统计学分词法论文研宄内容和作者的工作论文内容的组织结构第二章采用统计模型实现分词的原理序列标记问题统计模型原理隐马尔可夫模型最大熵马尔可夫模型条件随机场模型条件随机场模型用于分词的优势第三章傣语分词方法与实现傣语简介釆用实现分词傣语分词语料库傣语特征项的选取傣语字符位置关系的判别模型训练过程百录分词在上的实现第四章实验结果与分析实验平台的说明实验结果实验

6、结果分析第五章总结与展望总结展望参考文献觀第一章绪论第一章绪论引言什么是语音合成在以计算机为中心的信息科技飞速发展的今天,计算机可谓是影响着整个世界的军事、经济、社会以及文化等各个方面,同时计算机也成为了人们日常生活中查阅信息不可或缺的工具之一,而语音是一种特殊而又重要的信息载体,在信息化的今天处处可见它的身影,比如生活中常见的打声讯电话,钟表的语音报时,以及银行的自动取款机等等都使用了语音方面的技术,所以对语音的研宄愈发显得重要。近十几年来语音学的发展可谓是日新月异,新的理论,新的成果也如雨后春癸般冒了出来,比如基于隐马尔可夫模型以及基于神经网络模型的语音合成等等,但同时对它的研究也是极具

7、挑战的,比如包含了语音合成的人机对话就是一个很有难度且当下比较热门的研究领域,所以对于语音的研宄是一项前景十分光明且具有挑战的课题。对于语音的研究种类繁多,比如语音编码、语音合成、语音识别、语音转换、语音增强以及对说话人的情感特征进行转换等等,其中的我们要说的语音合成也即它是指通过一定的软硬件技术将文本字符串转化成可以听到的语音】。语音合成是实现人机对话的一个必要的环节,有了语音合成,就相当于让机器和人一样有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。