基于文本深度分析的剧情生成方法研究

基于文本深度分析的剧情生成方法研究

ID:42289496

大小:2.97 MB

页数:69页

时间:2019-09-10

基于文本深度分析的剧情生成方法研究_第1页
基于文本深度分析的剧情生成方法研究_第2页
基于文本深度分析的剧情生成方法研究_第3页
基于文本深度分析的剧情生成方法研究_第4页
基于文本深度分析的剧情生成方法研究_第5页
资源描述:

《基于文本深度分析的剧情生成方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、4善ll种我_硕士学位论文、S園參_:基于文本深度分析的剧情生成方法研究丨|:^1作者姓名范源学指导麵姓名'职称宋胜利碰授申请学位类别工学硕士西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研宄工作及取得的研宄成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含一为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。

2、与我同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一学位论文若有不实之处,切法律责任本人承担。.:这:本人签名令,日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研宄生在校攻读学位期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,结合学位论文研宄成果完成的论。文,署名单、发

3、明专利等成果位为西安电子科技大学:‘:导师签名本人签名料’日期:切戊年日日期:辞说抑学校代码10701学号1503121697分类号TP311密级公开西安电子科技大学硕士学位论文基于文本深度分析的剧情生成方法研究作者姓名:范源学一级学科:软件工程二级学科:软件工程学位类别:工学硕士指导教师姓名、职称:宋胜利副教授学院:计算机学院提交日期:2018年6月ResearchonTextDeepAnalysisbasedStorylineGenerationAthesissubmittedtoXIDIANUNIVERSITY

4、inpartialfulfillmentoftherequirementsforthedegreeofMasterinSoftwareEngineeringByFanYuanxueSupervisor:SongShengliTitle:AssociateProfessorJune2018摘要摘要随着计算机技术的发展,自然语言生成技术(NaturalLanguageGeneration,NLG)越来越受到人们的重视。自然语言生成技术可以用于生成与人类表达方式类似的自然语言句子。文本复述是自然语言生成技术的一个分支,它以另外一种方式表达原句

5、子的含义,能够应用于诸如机器翻译、智能问答等众多场景。文本复述技术已经有了较长时间的发展,但是目前对于由电影对话信息进行复述生成的研究比较少。以客观的方式对电影中的故事进行描述,生成对话的剧情信息,可以使用户高效的理解电影对话语义。但是由于对话信息的口语化和主观性特征,使得利用对话生成复述的技术面临很多困难。本文提出基于文本深度分析的剧情生成方法,具体可以分为自然语言对话抽取和电影剧情生成两个部分。对于电影字幕中的对话信息,本文设计了一个自然语言对话抽取方案。通过针对电影对话进行不流畅检测及处理,去除句子中的冗余信息;对对话进行指代消解

6、,提升句子的可理解性;将问句与答句进行信息合并,建立问答句之间的紧密联系,防止完整信息被拆分。为了将电影中不同的故事进行整理,本文利用语义关联关系对电影对话进行对话信息的划分,并使用基于语义的聚类方法进行对话场景的生成。为了保留对话中句子的语义信息,抛弃原有的句子表达方式,本文对对话文本进行信息抽取,提取出句子中的核心元素。为了获得带有关键要素的句子,本文设计了一个对话核心要素关联句获取方法。首先在多个搜索引擎上获取相关的句子,对这些句子进行基于搜索结果的相关位置及语义相关性的句子筛选,最终得到带有核心要素信息的关联句。为了简化关联句信

7、息,生成电影剧情的描述信息,本文设计了基于Attention机制的复述生成模型,通过引入Attention机制过滤掉不重要的词或短语,使模型更加关注重要的信息。本文设计了电影剧情生成模型的训练和生成方法,可以用于最终电影对话剧情的生成。最后本文通过数据集对本文的方法进行了实验。首先本文确定了基本的6个电影类别,并从IMDB上评价较高的电影中,针对每个类别分别选择了10个电影,以其电影字幕作为对话信息,以IMDB中的人工概述作为标准复述数据集。本文分别以一个示例对自然语言对话抽取和电影剧情生成的实验过程进行了介绍。通过利用ROUGE-1、

8、ROUGE-2和语义相似度的评估方法对实验结果进行评估,证明本文的方法相比于LEAD、MMR和TextRank方法有较大的性能提升。关键词:文本复述,对话信息抽取,关联句获取,复述生成模型,对话剧情生成IA

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。