基于神经网络的藏文律诗生成研究.pdf

基于神经网络的藏文律诗生成研究.pdf

ID:34502673

大小:2.39 MB

页数:56页

时间:2019-03-07

基于神经网络的藏文律诗生成研究.pdf_第1页
基于神经网络的藏文律诗生成研究.pdf_第2页
基于神经网络的藏文律诗生成研究.pdf_第3页
基于神经网络的藏文律诗生成研究.pdf_第4页
基于神经网络的藏文律诗生成研究.pdf_第5页
资源描述:

《基于神经网络的藏文律诗生成研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级公开UDC学号20151313001青海师范大学硕士学位论文དབང་རྩའ་ིད་ྲྭརྒྱས་སྙན་ངག་འབ་ིབར་རགས་ཙམ་དཔྱད་པ།基于神经网络的藏文律诗生成研究研究生姓名色差甲导师姓名(职称)才让加,教授申请学位类别文学硕士学科专业名称中国少数民族语言文学研究方向名称藏语计算语言学与机器翻译论文提交日期2018年3月论文答辩日期2018年5月学位授予单位青海师范大学学位授予日期2018年6月答辩委员会主席张有谊评阅人孙琦龙,乜国雷Ⅱ青海师范大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我

2、所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得青海师范大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。研究生签名:日期:青海师范大学学位论文使用授权声明青海师范大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权由青海师

3、范大学研究生部办理。研究生签名:导师签名:日期:Ⅱ摘要在互联网和人工智能日新月异的发展中,若能从非结构化的藏文律诗文本中提取结构化数据时,不仅能推动机器自动写诗的能力,而且在藏文智能信息处理中具有非常大的研究价值。该文首先介绍了律诗自动生成的研究背景和现状。然后进一步了解了自然语言处理领域中备受关注的词向量、循环神经网络、长短期记忆网络、编码器解码器模型以及注意力机制等的基本思路和数学原理。最后实现了如何从藏文网页或者电子书籍中获取藏文文本的方法,其中包括了从ePub文件类型中获取藏文文本的流程及其代码,还有藏文文本中获取藏文律诗的抽取算法及其代码。通过抽取算法共收集了373636

4、首藏文律诗,从中各抽取500首分别作为验证集和测试集,剩余的作为训练集。本文的主要生成模型借鉴了汉语律诗的自动生成模型。在藏文律诗生成模型中包含了三个小模型,分别是训练单个诗句的诗句模型、训练多个诗句的诗块模型以及训练主题生成首句的诗字模型,其中最基本的框架是一个基于双向LSTM的端到端模型。这三个小模型所使用的训练数据不一样,因此需要承担的任务也不同。每个模型的编码器中都使用了双向LSTM,主要是为了突出每个藏文诗句中的核心词,使得模型能够很好地捕捉到藏文诗句中的重要信息,而不用平等地看待诗句中的所有字信息。训练每个模型时源诗句和目标诗句都使用了正序,这样有利于LSTM和注意力机

5、制更好地从藏文律诗中学习相同词位上使用相同音节个数的规律,同时会保证藏文新律诗的节奏一致性问题。通常在藏文律诗中比喻词和源喻词处在相同的位置上,所以使用了局部注意力机制,这样不仅能加快计算速度,而且其生成结果没有明显下降。每个模型中引用了从藏文律诗语料中预先训练好的藏文音节向量来初始输入值,而不用随机值来初始化,这样既可以加快模型收敛的时间,又可以提升各个模型的生成结果。总之,藏文律诗生成模型在测试数据上BLEU值和ROUGE值分别能达到67.43%和68.81%,说明藏文律诗生成模型能生成具有一定流程度和忠实度的藏文新律诗。关键词:藏文律诗生成;神经网络;诗句模型;藏文音节向量I

6、AbstractIntheever-changingdevelopmentoftheInternetandartificialintelligence,ifwecanextractstructureddatafromunstructuredTibetanpoemstexts,wecannotonlypromotetheabilityofmachinestoautomaticallywritepoems,butalsohaveagreatdealofintelligenceinTibetaninformationprocessing.researchvalue.Thispaperfi

7、rstintroducestheresearchbackgroundandstatusquoofautomaticgenerationofpoems.ThenitfurtherunderstandsthebasicideasandmathematicsofWord2Vec,RNN,LSTM,End-to-Endmodels,andAttentionMechanismsinthefieldofNaturalLanguageProcessing.Finally,ameth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。