基于统计原理甄别算法研究与应用

基于统计原理甄别算法研究与应用

ID:45784757

大小:472.67 KB

页数:75页

时间:2019-11-17

基于统计原理甄别算法研究与应用_第1页
基于统计原理甄别算法研究与应用_第2页
基于统计原理甄别算法研究与应用_第3页
基于统计原理甄别算法研究与应用_第4页
基于统计原理甄别算法研究与应用_第5页
资源描述:

《基于统计原理甄别算法研究与应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、为遏制当前校园内盛行的学生为完成作业相互抄袭Z风,我们开发了一个论文甄别系统。这个系统利用现有的网络搜索引擎卜•载与学生上交的论文相关的文章,并口动把学生论文和下载到的文章进行和似程度分析以判断学生论文是否有抄袭行为。由于该系统可以在短时间内下载,甄别大量论文,因此大大提高了用手工从网络下载论文,人工判断的效率。木课题研究的线程池技术和应用回归分析中显著性检验原理而设计的一个文木甄別算法是这个论文甄別系统的核心技术。为高效下载网络中的相关论文,木课题以《Java多线程设计模式》(铁道出版社结城•浩著)介绍的一个通用线程池为

2、基础,用C#实现了一个专用线程池,并针对论文甄别系统的具体需求增加了动态地改变线程池中线程数量的管理功能,可以根据任务轻重自动调节系统负载,使系统始终保持高效率运行。应用回归分析中显著性检验原理而设计的一个文木甄别算法是木课题的最大亮点。它巧妙地借鉴了冋归分析屮用以检验拟合模型是否符合实际模型的显著性检验原理的思想,将其应用于分析相关关键词在学生论文和下载文章中分布的差异。利用统计分布的

3、2分布函数,构造岀二个近似服从k分布的统计量。使用这些统计量分析相关关键词在源论文和下载论文屮分布的差异,以此推断两篇文章的相似度。最后

4、,用三篇文章检验这个算法。检验结果证明这个算法具有很强的实用性。关键词多线程线程池多元线性回归显著性检验

5、2分布函数AbstractWehavedevelopedasystemforpaperscomparisoninordertorestrainthetideoftheplagiarismincampus.Thissystemdownloadsarticleswhicharesimilartotheassignedstudent^paperfromthesearchingengineintheInternetandcom

6、pareswiththembyitselfinordertoadjudicatewhetherthereisplagiarismintheassignedstudent^paper.Thesystemcandownloadandcomparealotofarticlesinshorttime.Soitraisesextremelytheefficiencyoftheworkwhichwasdonebyhand.Thethreadpoolmechanismforprogrammingandthealgorithmoftext

7、comparisonexcogitatedbystatisticstheoryarethenucleusskillsofthepapercomparisonsystem.ThispaperachievesaspecialthreadpoolwithC#basedonthecommonthreadpooldescribedin“Javamultithreadpattern^todownloadtherelativearticlesefficientlyfromtheInternet.Aimingatthesystemfort

8、herequirementsofthepaperscomparisonsystem,itwasenhancedwiththemanagementfunctionswhichcanchangethenumberofthreadinthethreadpooldynamically.Anditcanregulatethesystemloadbyassignmentdegreeinordertomakethesystemrunefficiently.Thealgorithmoftextcomparisonexcogitatedby

9、thetestofsignificancetheoryinregressionanalysisistheemphasisofthispaper.Thetestofsignificancetheoryregressionanalysisusestoverifywhetherthesimulatedmodelagreeswithvirtualmodelisappliedtoanalyzethedistinctionofdistributionofkeywordsrelatedbetweenstudents^paperandar

10、ticlesdownloaded・Withthetheoryofstatistics,theauthorconcludedtwofunctionswhichcomplythehdistributionandusedthesefunctionstoanalyzethekeywordsdistributio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。