文档复制检测web服务原型的设计与实现

文档复制检测web服务原型的设计与实现

ID:34018214

大小:887.60 KB

页数:62页

时间:2019-03-03

文档复制检测web服务原型的设计与实现_第1页
文档复制检测web服务原型的设计与实现_第2页
文档复制检测web服务原型的设计与实现_第3页
文档复制检测web服务原型的设计与实现_第4页
文档复制检测web服务原型的设计与实现_第5页
资源描述:

《文档复制检测web服务原型的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、太原理工大学硕士学位论文文档复制检测Web服务原型的设计与实现姓名:安旭君申请学位级别:硕士专业:@指导教师:彭新光20090301太原理工大学硕士研究生学位论文文档复制检测Web服务原型的设计与实现摘要随着网络数字资源的日益丰富和网络环境使人们对存取信息方式的影响,数字文档唾手可得,文档复制变得越来越容易。近年来,学术剽窃现象屡见报端,互联网上日益增多的重复网页降低了检索效率,给用户带来许多不便。文档复制检测技术是为了防止数字文档的非法复制和扩散而提出的,在知识产权保护和信息检索中有着重要应用。它可以防止剽窃事件的发生,提高互联网检索效率,是近年来数据安全领域研究的热点。

2、文档复制检测就是判断一篇给定文档是否抄袭、剽窃或者复制于另外一篇或者多篇文档的内容,剽窃不仅仅意味着原封不动地照搬,还包括对原作的移位变换﹑同义词替换以及改变说法重述等方式。本文首先介绍文档复制检测技术的发展背景、基本概念、国内外的研究现状、应用领域及科学意义。接着分析现有检测系统的功能和特点,并探讨构建系统所需要的JAVAEE架构体系、STRUTS框架、MVC模式、XML以及SQLServer等相关技术及其特点,提出了建立基于B/S三层架构的文档复制检测Web服务原型系统的构思。其次,本文设计并实现了文档复制检测Web服务原型系统的体系结构,该系统包括:用户注册登录模块、

3、文档上传模块、文档复制检测模块、用户与系统交互模块。该系统采用SQLServer2000作为后台数据库服务器,XML表示文档文件,用TOMCAT6.0作为Web服务器,使用JAVA语言编写Web服务器有关程序,客户端用网页浏览器即可访问本系统。基于上述工作,实现了文档复制检测Web服务原型系统,该系统基于文档关键词抽取文档特征信息,通过特征信息的匹配来检测文档之间的相似程度,为用户提供了在线文档复制检测服务。在此基础上进行了大量的系统测试,测试证明,该原型系统具有较强的可行性。关键词:复制检测,文本块,相似度,STRUTSI太原理工大学硕士研究生学位论文DESIGNANDI

4、MPLEMENTOFWEB-SERVICEPROTOTYPEFORCOPYDETECTIONDOCUMENTABSTRACTAsnetworkstechnologyhasrapidlydeveloped,thedigitalresourceisbecomingricherandricher,socopedeasily.Asaresult,thechangerofway,whichpeoplestoreandgetinformation,resultfromnetwork.Finally,thedigitaldocumentsgetmoreandmoreeasytoobtai

5、nandtheduplicationofdocumentsbecomesmoreandmoreeasy.Inrecentyears,theplagiarismofacademicpaperhasbeenfoundinthepressrepeatedly;theredundanthomepageinInternethasincreaseddaybydaywhichcutretrievalefficiencyandbroughtdifficultytotheuser.Thetechnologyofdocumentscopydetectionhasbeenputforwardto

6、preventillegalcopyandspreadofdigitaldocuments,whichisusedinintellectualpropertyprotectionandinformationretrieval.ItcanpreventplagiarismincidentsandimprovetheInternetretrievalefficiencywhichwasahotpointindatasecurityresearchinrecentyears.Copydetectionfordocumentsistojudgewhetherthegivendocu

7、mentplagiarizescontentsofotherdocumentsinthedatabase,whichplagiarismoccursinsomeways,suchasbyduplicatingpartialortotaldocumentcontentsandusingdifferentwordsorsentencestoexpressthesamemeaningofthetextsofperviousdocumentsinthedatabase.Firstly,thispaperintroduces

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。