欢迎来到天天文库
浏览记录
ID:32942533
大小:2.69 MB
页数:60页
时间:2019-02-17
《web数据挖掘中xml应用及关联算法改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、山东大学硕士学位论文Web数据挖掘中XML应用及关联算法改进姓名:张学冰申请学位级别:硕士专业:计算机软件与理论指导教师:郑永清20080405山东大学硕士学位论文摘要面向web的数据挖掘是一项复杂的技术,Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web上的信息五花八门,传统的Internet由各种类型的服务和数据源组成,包括wWw、FTP、Telnet等,现在有更多的数据和端口可以使用,比如政府信息服务、数字图书馆、电子商务数据,以及其他各种通过Web可以访问的数据库。Web上各种形式的文档和用户访问信息就构成了W
2、eb数据挖掘的对象。根据挖掘对象的不同,我们将Web数据挖掘分为三类:Web内容挖掘、Web结构挖掘、Web用法挖掘。由于XML能够使不同来源的结构化的数据很容易地结合在一起,因而使搜索多样的不兼容的数据库能够成为可能,从而为解决数据挖掘难题带来了希望。Apriori算法在关联规则领域有很大的影响力,然而由于需要过于频繁的扫描数据库及较大的空间消耗,仍然有需要改进的地方。通过对Apriori算法进行深入研究,本文提出了一种Apriori改进算法,通过比较分析,获得了较好的效率和性能。本文完成的主要工作如下:(1)完成了对基于XML的Web数据
3、挖掘的技术研究。本文通过对XML这种近几年出现的具有很大潜力的Internet数据交换技术的研究分析,提出了基于XML的Web挖掘的新思路,并且完成了对XML的Web挖掘系统的系统功能设计。(2)实现了)(ML到数据库模式的转化工具。本文主要针对XYL的DTD文档,提出了一系列从)(ML到关系数据库模式的转换算法,从而也就把基于XML的Web数据挖掘与传统的基于关系数据模式的数据挖掘算法建立了联系。(3)对Apriori算法进行深入分析,并提出了一种优化算法。关键字:Web数据挖掘、关联规则、煳L、文本挖掘、Apriori算法山东大学硕士学位
4、论文ABSTRACTWebminingisacomplextechnology,whichrefertotheprocessofinformationorresourcediscoveryfrommillionsofsourcesacrosstheWorldWideWeb.Thedocumentsanduserinformationuserbrowsingoneormoreweblocalitiesarethetargetofwebdatamining.Webminingcandividedintodatamining、structuremi
5、ningandlogminingaccordingtodifferentminingtarget.Asxmlcancombinestructuraldataeasily,itispossibletominingmultipledatabase.InthispaperwestudyanddiscusstheuseofXMLasdataswitchpatterninwebdataminingandweblogminingarea.Datamininginassociationruleisanimportantresearchtopicandapr
6、ioriisthecorealgorithminminingassociationrule.Weproposeamethodthatenhancestheefficientofalgorithmbyevaluatingtheprobabi1ityofcandidatefrequentitemsets.Itshortenstheruntimeofalgorithmbyreducingthetimesofscanningdatabase.Aformulaisprovidedinthispaper.Inthispaperwewanttodiscus
7、stheuseofXMLforthewebminingareaandaccomplishedthefollowingtasks:1.StudythemethodthatappliestheXMLtechnologyinthewebminingasystemofwebminingbasedonXML.InthispaperwestudytheInternetdataswitchtechnologyofxmlrecentyears.Weadvanceanewmethodofdataminingbasedxml.andwedesignedthefu
8、nctionofdataminingsystembasedⅫfL.2.ImplementethealgorithmsfromconvertingXMLdocumen
此文档下载收益归作者所有