网站日志关联性挖掘技术的研究与应用

网站日志关联性挖掘技术的研究与应用

ID:33094535

大小:2.41 MB

页数:70页

时间:2019-02-20

网站日志关联性挖掘技术的研究与应用_第1页
网站日志关联性挖掘技术的研究与应用_第2页
网站日志关联性挖掘技术的研究与应用_第3页
网站日志关联性挖掘技术的研究与应用_第4页
网站日志关联性挖掘技术的研究与应用_第5页
资源描述:

《网站日志关联性挖掘技术的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东北大学2008年12月NortheasternUniversityDecember2008▲^‘,-^~J论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。(如作者和导师不同意网上交流,请在下方签名;否则视为同意。)学位论文作者签名:导师签名:签字同期:签字日期:,^▲1^●r’东北大学硕士学位论文摘要网站日志关联性挖掘技术的研究与应用摘要Internet的迅猛发展,尤其是Web

2、的全球普及,使得Web上信息量无比丰富。通过对Web的挖掘,可从Web页面中提取所需的知识:对总的用户访问行为、频度、内容的分析,可得到关于群体用户访问行为和方式的普遍知识,用以改进我们的Web服务设计。而更重要的是,通过对这些用户特征的理解和分析,可以有助于开展有针对性的活动。网络技术已经渗透到了社会生活的方方面面,随着因特网在世界范围的迅速发展,越来越多的数据库和信息系统不断加入网络,使得Intemet发展为当今世界上门类最全、规模最大的信息库。在带给人们全新网络世界的同时,也将网络上的人们置于

3、了一个庞大的网络迷宫,面对缤纷复杂的空间,笔者在简述了数据挖掘技术、Web日志挖掘、研究内容、关键技术和目前的国内外研究状况的基础上,针对黑龙江大学网站的访问日志,采用数据挖掘技术进行数据分析,从而找出用户访问的规律和内容喜好,为改进网站结构和内容提供了决策支持。本文主要研究了日志挖掘技术,论述了数据预处理的过程、方法以及难点解决,包括用户识别技术,路径补充技术等。介绍了关联规则的经典算法Apriori算法,以黑龙江大学网站为日志挖掘对象,使用Apriori算法对经过数据预处理后的日志文件进行分析,

4、并提出了不足与未来的研究发展方向。关键词:数据挖掘;Web日志挖掘;关联规则;数据预处理;Apriori算法.^◆一◆^上r东北大学硕士学位论文AbstractTheresearchandapplicationofweblogassociationminingtechnologyAbstractTheswiftandviolentdevelopmentofInternet,especiallythewholeworldsofWebpopularizesandWebincomparablyabunda

5、ntamountofinformation.ThroughWebmining,wecandrawnecessaryknowledgefromWebpage:toanalyzethecontentstototaluserreceiveandvisitbehaviorandfrequentness,wecangetthegeneralknowledgeofbehaviorandmodeofusers,andusethattoimproveourwebserve.Andmoreimportance,thr

6、oughtheunderstandingandanalyzingofuser、scharacteristic,itcanhelpanddeveloptheactivities.Networktechnologyhadalreadypermeatedeverysideofsociallife.Becausemoreandmoredatabasesandinformationsystemscontinuallyjoinedintheinternet,ithadbeendevelopedintothewo

7、rld’Smostcompleteandlargestinformationstorehouse.Atthesametimeofbringingaperfectnewworld,italsoplacedpeopleontheintemetinaenormousmaze,Facingflourishingcomplicatedspace,theauthorintroducedthebaseondatamining、weblogmining、thecontentofstudy、keytechnology

8、andthecurrentstateofinteriorandoverseasstudy,especiallyanalyzedthedataofthewebsitevisitinglogofHeilongjiangUniversitybyadoptingdataminingtechnology,thus,thevisitingregularandcontentloveofusersandsuppliedthesupportofdecisionforimprovemen

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。