高考历史简答题自动评价方法研究

高考历史简答题自动评价方法研究

ID:35104134

大小:1.92 MB

页数:63页

时间:2019-03-18

高考历史简答题自动评价方法研究_第1页
高考历史简答题自动评价方法研究_第2页
高考历史简答题自动评价方法研究_第3页
高考历史简答题自动评价方法研究_第4页
高考历史简答题自动评价方法研究_第5页
资源描述:

《高考历史简答题自动评价方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文高考历史简答题自动评价方法研究RESEARCHONAUTOMATICEVALUATIONMETHODFORSHORTANSWERQUESTIONSINCOLLEGEENTRANCEEXAMINATION杨靖云哈尔滨工业大学2016年6月国内图书分类号:TP391.3学校代码:10213国际图书分类号:681.37密级:公开工程硕士学位论文高考历史简答题自动评价方法研究硕士研究生:杨靖云导师:李生教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:

2、TP391.3U.D.C:681.37DissertationfortheDoctoralDegreeinEngineeringRESEARCHONAUTOMATICEVALUATIONMETHODFORSHORTANSWERQUESTIONSINCOLLEGEENTRANCEEXAMINATIONCandidate:YangJingyunSupervisor:Prof.LiShengAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerTechnologyAffiliation:Sc

3、hoolofComputerScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工程硕士学位论文摘要高考是全国范围内最重要的考试之一,试卷评阅质量是决定考生得分的关键环节。高考题目中的主观题包括简答题、论述题、作文题等多个类型,目前全部由人工阅卷评分。但该过程会受到多个因素的影响,例如阅卷人对所判科目的理解全面程度,答题人所列要点清晰程度、卷面整洁程度等,并且阅卷工作量巨大,将耗费一定的人力和时间

4、。因此我们考虑使用自然语言处理方法初步探索用计算机阅卷的可能性。本题目实质上是研究简答题的学生答案与标准答案间的文本相似度和学生答案得分之间的联系,而文本间的匹配可以通过建立多种不同的模型来实现。本文主要从以下几个方面探索了学生答案和标准答案间的相似度:第一,计算文本间的N-gram共现准确率、召回率等是基本思路。我们分析总结了BLEU和ROUGE所使用的N-gram共现计算方法,并将它们应用到了简答题自动评价问题中。我们使用了spearman秩相关系数在答案数据集上检验N-gram共现特征与数据得分之间的相关性。最后通过传统的机器学习方法——排序支持向量

5、机(Rankingsupportingvectormachine)在这些特征上筛选得到能使模型排序效果最好的特征集合。第二,我们认为仅靠N-gram共现特征是不够的。浅层语言学知识包括词法、句法和语义三个方面,其中词法和语义特征都是需要进一步探索的。文本是由许多不同的词组成,词性不同的词在句子中的重要程度也不同。显然,在学生答案与标准答案间共现的词中动词、名词可能会比其他词性成分重要。因此我们将计算基于词性的词汇共现特征。另外,我们还可以将名词进一步延伸为特定的历史学相关专有名词,也具有一定重要性。语义相似度上我们应用了信息检索中查询与文档间的相似度计算方

6、法。第三,深度学习已逐渐从最开始的计算词的分布表示逐渐发展到计算包含更多语义信息的短语、句子、文本等。词向量一个最基本的应用是计算两个词语的语义相似度。相应的,当我们根据一个完整的语料库训练出的模型得到的句子向量,也应能够给出两个句子的语义相似度。我们利用深度学习中神经网络的方法将学生答案和标准答案表示成包含丰富语义信息的句向量,并将向量间相似度作为学生答案和标准答案间的语义相似度。关键词:简答题字动评价;N-gram共现;词性;语义相似度;深度学习-I-哈尔滨工业大学工程硕士学位论文AbstractTheentranceexamisoneofthemos

7、timportantnationwide,thequalityofthepapersarethekeytodeterminethecandidatesscore.Thesubjectivequestionsinthecollegeentranceexaminationincludeasimpleanswer,discussionquestions,essayquestions,andothertypes,andatpresent,allbythemanualmarking.Buttheprocesswillbesubjecttotheinfluenceof

8、manyfactors,suchasmarkingonthejud

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。