欢迎来到天天文库
浏览记录
ID:34809479
大小:1.88 MB
页数:65页
时间:2019-03-11
《试析基于web数据挖掘分类算法的个性化信息服务》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、太原理工大学硕士学位论文基于Web数据挖掘分类算法的个性化信息服务姓名:郭鹏申请学位级别:硕士专业:计算机应用技术指导教师:史应文;陈俊杰2003.4.1———磐娑磐鲨而彳基于Web数据挖掘分类算法的个性化信息服务摘要随着Intemet技术的发展,继数据挖掘技术成功地应用于传统数据库领域后,人fLT.开始尝试将其应用于其他类型的数据库。基于Web的数据挖掘技术(简称Web挖掘)就是在这种背景之下发展起来的。本论文介绍了数据挖掘、Web挖掘技术和OLAP技术的理论发展及实际应用,并重点研究了数据挖掘中
2、分类算法在Web挖掘中的应用,从而实现各类用户的个性化信息服务。论文主要内容有以下几部分组成:1.介绍数据挖掘技术的发展,挖掘过程及分类算法的实际应用情况.2.详细讨论web挖掘技术.包括w曲挖掘产生的背景,技术特点,Web访问挖掘的用户访问事务确定方法等.3.详细介绍了一种基于Web数据挖掘的分类算法.4.为了实现用户个性化信息服务,作者将上面提到的算法应用到了Web数据挖掘上,并对其中的决策树建树算法进行了改进。这一部分是本论文的重点.5.最后作者建立了在线个性化信息服务工具模型,提出下一步要做
3、的工作并展望了Web挖掘技术未来发展方向。关键词:数据挖掘WEB挖掘分类规则0LAP概念归纳INDIⅥDUALINFORMATIONSERⅥCEBASEDoNWEBDATAMININGCLASSIFICATIONALGORITHMABSTRACTWiththedevelopmentofIntemettechnology,peoplebegintoattempttoapplydataminingtechnology,whichhasbeenappliedintraditionaldatabasesuc
4、cess向lly,intothecaseofusingothertypesofdatabase.ThedataminingtechnologybasedonWeb,whichiscalledWebminingsimply,Occursinthiscase.Weintroducesthedevelopmentandapplicationofdatamining,WebminingandOALPtechnologiesandfocusesontheresearchofWebminingapplicati
5、onusingclassificationalgorithmofdataminingforindividualinformationservice.Thispaperconsistsofthefollowingparts:1.introductionofdevelopmentofdatamining,mimngprocedureandapplicationOnclassificationalgorithm.2.detaileddiscussionofWebminingtechnology,inclu
6、dingthehistoryandthecharacteristicofWebminingandmethodsofdetermininguseraccesssession,etc.3.detailedintroductionofanonlineclassificationalgorithmbasedonconceptualinduction.4.thecoreofthepaperistheimprovementofthedecisiontreealgorithm,whichisappliedinth
7、eW曲dataminingforthepurposeofindividualinformationservice.5.finallythetoolmodelfortheonlineindividualinformationserviceisoffered,SOdothenextworkandprospectthefutureofwebdataminingtechnology.Keywords:DataMining,WebMining,ClassificationRules,OLAP,conceptu
8、alInduction.第一章绪论1.1.选题目的和意义进入2l世纪,随着Internet迅猛的发展,可利用信息资源越来越多,人们面对着海量无组织的信息,越来越难以从中发现对自己有价值的信息,这种现象被称为信息过载。还有随着Internet上信息类型的不多扩大,人们在网上找到自己感兴趣的信息变的越来越困难,这就是所谓的资源迷向。而面对以上的问题,现有的信息发布出现以下三个缺点[1]:≯受网络的限制:在Internet上,信息是分布到各个站点上的,而搜索引擎检索信息完全
此文档下载收益归作者所有