基于vsm模型的文本相似度检查软件的设计与实现

基于vsm模型的文本相似度检查软件的设计与实现

ID:16110046

大小:2.02 MB

页数:31页

时间:2018-08-08

基于vsm模型的文本相似度检查软件的设计与实现_第1页
基于vsm模型的文本相似度检查软件的设计与实现_第2页
基于vsm模型的文本相似度检查软件的设计与实现_第3页
基于vsm模型的文本相似度检查软件的设计与实现_第4页
基于vsm模型的文本相似度检查软件的设计与实现_第5页
资源描述:

《基于vsm模型的文本相似度检查软件的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、学号:1110211014本科毕业论文(设计)(2013届)基于VSM模型的文档相似度检查软件的设计与实现院系计算机科学与技术系专业计算机科学与技术姓名指导教师职称助教合肥师范学院2013届本科生毕业论文(设计)基于VSM模型的文档相似度检查软件的设计与实现摘要近年来,论文抄袭、学术打假日益成为学术界和媒体界关注的话题。尤其在现在的高校中,学生经常为了应付老师布置的作业而直接或间接的抄袭别人的劳动成果。长此下去,高校学生的诚信度将受到严重质疑,那么采取一种有效的方法遏制学生抄袭的现象,成为一个现实的需求。因此,文本相似度检测应运而生。本次设计的基于VSM模型的文档相

2、似度检查系统主要是进行一个理论的研究。系统适用于对学生提交的实验报告、电子档作业等进行检测,从而提高学生独立完成作业的积极性。本系统基于C#语言和数据库技术,采用著名的向量空间模型VSM方法,对文本分词、词频统计及相似度计算三大功能进行模块化的设计,条理清晰,实现了文档相似度的计算,对检测学生的抄袭行为有很大的实用价值。关键词:论文抄袭VSM模型文档相似度数据库技术合肥师范学院2013届本科生毕业论文(设计)ABSTRACTInrecentyears,theplagiarism,theacademiccrackdownisincreasinglybecomingat

3、opicofconcerninacademiaandthemediaindustry.Especiallyintheuniversities,inordertomeettheteacherassignments,thestudentsoftendirectlyorindirectlyplagiarizethelaborofothers.Ifthistrendcontinues,theintegrityofthecollegestudentswillbeseriouslyquestioned.Thentakinganeffectivewaytocurbthepheno

4、menonofstudentplagiarismbecomesarealisticdemand.Therefore,thetextsimilaritydetectioncameintobeing.ThissimilarityexaminationsystembasedonVSMmodelismainlyatheoreticalresearch.It’ssuitableforstudentstosubmitthetestinglabreportsandelectronicarchiveswork,etc,soastoboosttheenthusiasmofthestu

5、dentstofinishthehomeworkindependently.ThesystemwhichusingthefamousmethodofVSMvectorspacemodelisbasedonc#languageanddatabasetechnology.Thetextparticiple,wordfrequencystatisticsandsimilaritycalculationfunctioncarriesonthemodulardesign.Thissystemimplementsthecomputingdocumentsimilarity.It

6、isofgreatvaluetodetectstudent’splagiarism.Keywords:ThesisplagiarismVSMmodelDocumentsimilarityDatabasetechnology合肥师范学院2013届本科生毕业论文(设计)目录第1章绪论11.1课题背景11.2课题研究意义11.3开发语言11.4设计任务2第2章系统原理介绍22.1系统原理概述22.2系统相关知识点简介32.3系统实现思想6第3章系统架构设计73.1系统需求分析73.2系统功能概述73.3系统性能要求93.4功能模块设计93.5数据库设计10第4章系统实现1

7、24.1系统运行环境124.2界面实现124.3相关代码分析16第5章系统测试175.1相似度检测175.2记录查看检测20第6章总结与展望216.1系统总结216.2系统展望22致谢23参考文献24附录25合肥师范学院2013届本科生毕业论文(设计)第1章绪论1.1课题背景随着计算机的广泛应用以及Internet的普及,互联网逐渐成为当今世界上最大的信息库,人们可以非常便捷从网络中获得想要的信息,但与此同时也带来了一些问题,诸如非法复制、非法分发等文档侵权。在如今的高校中,学生的论文抄袭、作业抄袭现象更是屡见不鲜。学生日益对自己的作业马虎了事,随便抄抄了事。尤

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。