欢迎来到天天文库
浏览记录
ID:281632
大小:1.67 MB
页数:39页
时间:2017-07-18
《基于FTP日志的数据挖掘系统-数据预处理系统的设计与实现 毕业设计论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、本科毕业设计题目:基于FTP日志的数据挖掘系统-数据预处理系统的设计与实现摘要计算机和互联网爆炸式发展的发展让我们看到信息时代到来的大潮,我们在网络上的行为也自然成为一种可挖掘的“财富”。国内外的高校或是科技企业也越来越多的投入到网络数据日志的数据挖掘挖掘中去,为的是帮助商业机构或是社会组织提供基于精准数据决策建议。校园教学FTP日志作为一种长期存在的数据也具有非常高的数据价值。针对FTP的运行日志的数据挖掘系统是通过对校园教学FTP日志的定时提取、数据预处理、数据挖掘、结果可视化的方法实现信息的挖掘。运用eclipse软件开发相关平台;采用多线程处理的方法为我们提高
2、处理的基础数据时的处理效率;利用分布式计算的方式组建可根据需要添加计算能力的计算机客户机、搭建Lucene搜索引擎式的全文搜素数据库为数据挖掘提供高速索引的角色、经过我们优化的关联算法进行数据挖掘后,利用JFreeChart2应用程序用图形化的方法显示数据的相关联性。该系统实现了FTP日志数据的定期自动获得、并会对提供运算能力的客户机进行运算前的能力扫描、实现了主要服务器中的文件切割、建立了Lucene全文数据搜索引擎、实现结果信息图标可视化。关键词:FTP日志;数据挖掘;数据预处理;索引库AbstractThedevelopmentoftheexplosivegro
3、wthofcomputersandtheInternetallowsustoseethetideofthearrivaloftheinformationage,ourbehavioronthenetworkhasnaturallybecomeaminingwealth.Universitiesortechnologyenterprisesathomeandabroad,moreandmoreintothenetworkdatalogdatamining,inordertohelpcommercialorganizationsorsocialorganizationst
4、oprovidepolicyrecommendationsbasedonaccuratedata.CampusteachingFTPlogalsohasaveryhighdatavalueasalong-termdata.ForarunninglogoftheFTPdataminingsystemisthetimingofthecampusteachingFTPlogextraction,datapreprocessing,datamining,miningresultsvisualizationinformation.Eclipsesoftwaredevelopme
5、ntplatform;multi-threadedprocessingmethodforustoimprovetheprocessingofdataprocessingefficiency;usingdistributedcomputingtosetupthecomputerclientcanaddcomputingpower,tobuildthefulltextoftheLucenesearchengine-Searchprimedatabasedataminingroletoprovidehigh-speedindex,weoptimizeassociationa
6、lgorithmdataminingusingJFreeChartapplicationswithgraphicaldisplaydataassociated.ThesystemrealizestheofregularFTPlogdataautomaticallygetandwillprovidethecomputingpoweroftheclienttheabilitytoscanbeforetheoperation,themainfileservercuttingLucenefull-textsearchengineresultinformationiconvis
7、ualization.Keywords:FTPlog;datamining;datapreprocessing;indexinglibrary目录第1章绪论61.1选题背景61.2国内外研究现状61.2.1国外研究状况71.2.2国内研究状况71.3本文研究的内容和意义7第2章可行性分析和需求分析82.1可行性82.1.1实用性价值:82.1.2技术可操作性82.1.3外部运行环境82.1.4日常管理92.2需求分析92.2.1软硬件环境需求92.2.2用户需求92.2.3功能需求10第3章FTP日志数据挖掘系统113.1系统设计的基本原理113.2
此文档下载收益归作者所有