欢迎来到天天文库
浏览记录
ID:35070401
大小:3.19 MB
页数:53页
时间:2019-03-17
《基于语义依存树的主观题自动评分算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码10530学号201330111810分类号TP391密级硕士学位论文基于语义依存树的主观题自动评分算法研究学位申请人段威指导教师刘新副教授学院名称信息工程学院学科专业计算机技术研究方向数据挖掘二○一六年四月二十七日ReseachonAutomaticScoringAlgorithmBasedonSemanticDependencyTreeCandidateDuanWeiSupervisorProf.LiuXinCollegeCollegeofInformationEngineeringProgramComputerTechnologySpecializationDa
2、taMiningDegreeMasterofEngineeringUniversityXiangtanUniversityDateApr.27th2016湘潭大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中レッ明确方式标明。本人完全意识到本声明的法律后果由本人承担。点作者签名:走曰期;年^月^曰学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用
3、学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湘潭大学可将本学位论文的全部或部分内容编入有关数据库进行レ检索,可ッ采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名;麵曰期;Toik^月名曰、曰期;年《占曰导师签名;月摘要随着考试自动化的普及,计算机阅卷已经逐渐被应用到日常的线上考试中。一般来说,考试题类型分为客观题和主观题两种。目前,客观题的计算机自动评分技术已经非常成熟并且广泛应用到实际中。而简答题、论述题等主观题型,由于其答案是由完整的自然语言
4、描述的,对这类试题的评分可能涉及到自然语言处理、模式识别甚至是人工智能等领域的知识,因而实现起来非常困难。如何有效地正确地对主观题进行自动评分,无论是在实际应用还是在学术领域中,都是一个亟待解决的问题。本文在考察目前国内外主观题自动评分相关研究的基础上,总结出目前比较常用的方法是计算参考答案和考生答案之间的文本相似度。在文本相似度计算方面,大多数的研究是基于关键词的匹配进行的。而关键词匹配大体有三个方向。其一是通过词性、句法依存分析或者是统计学方面的技术对文本的关键词进行筛选,最终选出最能代表文本语义的关键词集合;其二是针对关键词进行同义词扩展从而加大关键词的匹配范围;其三,
5、是将句子抽象成由关键词组成的某种模式,进而以这种模式为基本单位进行匹配。以上的方法都在试图找到一种最适合表征语义的方法,然而由于自然语言的复杂性,这些方法的效果都不太理想。本文在总结了现有的研究成果的基础上,提出了利用语义依存分析来构建语义依存树,进而用语义依存树来表征句子语义的方法。与现有的文本表示方法不同的是,这种方法的特点在于能表征句子的主干语义信息,即文本表达式和原句子的主干语义是可以相互推导的。在此基础上,本文进一步提出了基于语义依存树文本表示方法的文本语义相似度计算方法。这种方法分为词语级相似度计算、句子级相似度计算和全文级相似度计算三个阶段。其中,词语级相似度计
6、算采用了现有的研究成果。在句子相似度计算方面,文本在结合了人工阅卷经验的前提下,阐述了文本相似度与答案相似度的区别,为现有的单纯地以文本相似度作为评分依据的方法所造成的问题提供了一个可行的解决方向。在全文级相似度计算方面,与现有的计算参考答案和考生答案之间的相似度的方法不同的是:本文提出的方法是以参考答案为标准,计算考生答案相对于参考答案的相似度。文中详细阐述了这两种方法的区别,并验证了本文提出的方法的合理性。本文最后设计并实现了相应的对比实验且取得了较好的效果,并总结出其中的不足之处,对接下来的研究工作进行了展望。关键词:语义依存;语义依存树;自动评分;语义相似度IAbst
7、ractWiththepopularityofthetestautomation,computerscoringhasbeengraduallyappliedtodailyonlineexam.Ingeneral,thetypeofexamquestionsaredividedintotwokindsofobjectivequestionsandsubjectivequestions.Currently,automaticscoringofobjectivequestionsofcomputertech
此文档下载收益归作者所有