web访问信息挖掘技术的研究

web访问信息挖掘技术的研究

ID:33415679

大小:348.89 KB

页数:53页

时间:2019-02-25

web访问信息挖掘技术的研究_第1页
web访问信息挖掘技术的研究_第2页
web访问信息挖掘技术的研究_第3页
web访问信息挖掘技术的研究_第4页
web访问信息挖掘技术的研究_第5页
资源描述:

《web访问信息挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、南昌航空工业学院硕士学位论文WEB访问信息挖掘技术的研究姓名:方芳申请学位级别:硕士专业:检测技术及自动化装置指导教师:周力20060601摘要数据挖掘和WorldWideWeb是当前计算机科学两个重要的研究领域,将二者结合起来就形成了新的研究领域Web数据挖掘。Web数据挖掘是从WorldWideWeb上发现和分析有用的信息,包括Web内容挖掘、Web结构挖掘和Web访问信息挖掘。本文介绍了数据挖掘和Web数据挖掘,论述了数据挖掘的定义、特点和挖掘过程,讨论了Web数据挖掘的特点和应用领域。同时详细讨论了Web访问信息挖掘。提出了一个通用的

2、Web访问信息挖掘模型。模型包括三个主要步骤:数据准备和预处理、模式发现和模式分析。在数据准备和预处理阶段,主要研究了用户和会话的识别方法。第二步骤模式发现是Web数据挖掘最重要的部分,本文重点研究关联规则、序列模式、分类和聚类的挖掘方法,定义了关联规则和序列模式的数据模型。路径分析是Web访问信息挖掘特有的模式,本文设计了一种分阶段的挖掘算法。模式分析是Web访问信息挖掘的最后一个阶段,它帮助用户从大量的模式中获取有用的知识,并使复杂的模式易于理解。查询机制、OLAP技术和可视化技术是最常用的解决方法。本文对OLAP技术与数据挖掘的结合提出

3、了一个的解决方法。最后实现一基于电子商务站点的挖掘方案。关键词:Web访问信息挖掘,预处理,模式发现,模式分析iAbstractTwoimportantandactiveareasofcurrentresearcharedataminingandtheWorldWideWeb.Acombinationofthetwoareasproducedanewresearchfield-Webmining,thefunctionofwhichistofindandanalyzeusefulinformationfromWorldWideWeb,incl

4、udingWebContentMining,WebStructureMiningandWebUsageMining.TheDataMiningandtheWebDataMiningareintroducedinthisthesis.TheDataMining’sdefinition,characteristicsandtheminingprocessarepresented.ThecharacteristicsofWebDataMiningandit’stheapplicationdomainarediscussed.TheWebUsageM

5、ininghasalsobeendiscussedinthisthesisandageneralWebUsageMiningmodelhasbeenpresented.Themodelincludesthreemainsteps:DataPreparing&Preprocessing,PatternDiscoveryandPatternAnalysis.Inthepreparing&preprocessingstage,theuserandtheSessionIdentificationmethodhasbeenmainlydiscussed

6、.ThepatterndiscoveryisthemostimportantpartoftheWebUsageMining.MethodofAssociationRules,SequentialPatterns,ClusteringandClassificationhaveallbeendiscussedinthispaper.ThedatamodelofAssociationRulesandSequentialPatternshavealsobeenpresented.SincePathAnalysisistheuniquemethodin

7、WebUsageMining,onekindofstageminingalgorithmhasbeenproposedinthisthesis.ThepatternanalysisistheWebUsageMining’slaststage,whichmakesknowledgeacquirableandunderstandable.TheQuerymechanism,theOLAPtechnologyandtheVisualizationtechnologyarethemostcommonlyusedmethods.Onecompletes

8、olutionbycombiningtheOLAPtechnologywithDataMininghasbeenpresentedinthispaper.Final

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。