web日志挖掘及其应用的研究

web日志挖掘及其应用的研究

ID:34701269

大小:5.22 MB

页数:110页

时间:2019-03-09

web日志挖掘及其应用的研究_第1页
web日志挖掘及其应用的研究_第2页
web日志挖掘及其应用的研究_第3页
web日志挖掘及其应用的研究_第4页
web日志挖掘及其应用的研究_第5页
资源描述:

《web日志挖掘及其应用的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、论文摘要WEB是一个非常巨大的信息来源地,不过提供这些信息的网站结构是否合理,唯一的评估者是访问浏览它的用户。每次用户的访问都会在WEB服务器上记录一条访问日志,根据这条日志可知用户访问此站点的URL,用户的IP地址以及访问时间等信息。我们通过对这些日志信息的分析和处理,可提取出访问者的WLP(WebLogPath)。分析这些WLP并挖掘出用户的通用行为模式,可以调整网站结构,优化系统性能,进一步提高对WEB终端用户的服务质量。本文意在通过对WEB日志的挖掘和用户访问模式的研究,开发出一套基于WEB日志挖掘的智能网站知识提取系统。该系统通过对WEB访问日志的分析,提出了真实路径获取算法,

2、前向访问路径截取算法,可发掘出多用户的通用访问模式,单用户的个人喜好访问模式;提出了目标页面确定算法,页面关联规则发现算法,用于找出互联网目标页面间的隐链接;发现了回溯过多的不合理页面节点,从而调整和优化了现有的网站结构;提出了用户访问路径会话集发现算法,加权网站结构图生成算法,用于发掘WEB站点的频繁遍历主干子网,可以为生成3G手机应用的WAP子网提供参考;提出了单用户搜索关键字关联规则发现算法,可以为单个用户提供量身定做的个性化搜索引擎服务;提出了一种新的数据随机干扰处理方法,实现了隐私保护关联规则挖掘模型;以及采用数据仓库和OLAP技术,实现了挖掘信息的统计决策及图形化表示。本文研

3、究的网站日志挖掘算法及应用模型是当前互联网海量信息处理研究较为活跃的一个领域,模型本身体现了较先进的思想。通过有针对性的各种网站日志挖掘算法,可以发现用户通用访问模式,找到网站页面问隐藏的关联规则,从而实现网站结构的改进策略,以及在电子商务网站中实现最大的商机撮合。关键词:WEB日志挖掘,智能网站知识提取系统,真实路径获取算法,页面关联规则发现算法,站点结构调整,个性化搜索引擎,数据随机干扰处理方法ABSTRACTWebisahugeinformationsource,butonlytheuser,whooftenvisitsthewebsite,candeterminewhethert

4、hestructureofthewebsiteisproper.EachvisitofUSerwillregisteravisitlogonthewebserver.Fromtheweblog,wecangettheinformation,suchas:URL,whichtheUServisited,theUSer’SIPaddressandtheUSer’Svisittime.Inthispaper,wedevelopanintelligencewebsiteknowledgeextractionsystembyanalysistheweblogs.Usingit,webmanager

5、cangettheUSer’Slatentevaluationtothewebatanymoment,adjusttheimproperwebstructure,andgraspthevisitstatueofthewholewebsiteresource.Intelligencewebsiteknowledgeextractionsystemincludesthedatapreprocess,datawarehousesubsystembasedonOLAPtechnology,knowledgeextractionsubsystembasedonweblogmining.Byanal

6、yzingtheWeblogs,thesystemCandiscovergeneralwebaccesspatterns;findthetargetpagesassociationrule;implementtheadjustmentandreorganizationofwebsiteorganization;getthemajorsubwebsitestructureforthemobilephonevisitors;discoverthepersonalizedsearchenginemodel;presentaneffectivemethodforprivacypreserving

7、associationruleminingmodel.DatawarehousesubsystembasedonOLAPtechnologysetupadatawarehousebyusingthehugeweblog,onwhichwecanuseOLAPtechnology,andmasterthevisitstatueofthewholewebsiteresource.Asshownintheexperimentalresul

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。