web日志聚类分析及应用

web日志聚类分析及应用

ID:33179568

大小:3.18 MB

页数:57页

时间:2019-02-21

web日志聚类分析及应用_第1页
web日志聚类分析及应用_第2页
web日志聚类分析及应用_第3页
web日志聚类分析及应用_第4页
web日志聚类分析及应用_第5页
资源描述:

《web日志聚类分析及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号单位代码学号功萦六了硕士学位论文论文题目日志聚类分析及应用作者姓名汤国行专业计算机软件与理论指导教师姓名专业技术职务赵合计副教授年月日山东大学硕士学位论文旦旦鱼鱼旦里鱼鱼旦旦鱼旦旦鱼鱼鱼旦鱼鱼旦坦鱼鱼鱼旦旦鱼鱼旦鱼鱼鱼里鱼鱼鱼旦鱼鱼鱼旦鱼鱼鱼旦鱼鱼鱼旦鱼鱼鱼旦旦鱼鱼旦旦鱼旦旦鱼鱼夕旦鱼鱼甲鱼鱼鱼鱼鱼鱼坦鱼鱼鱼旦鱼鱼鱼里鱼鱼鱼里鱼鱼鱼旦旦鱼鱼旦旦鱼鱼旦旦鱼鱼旦目录摘……,……,……要……,…‘,二、……、………第……、‘,…、、……一章绪论课题背景……国内外研究现状‘……论文组织结构…………第二章数据挖掘概述……数据挖掘的必要性数……,……据挖掘定义……数据挖掘的分析方

2、法神……,经网络聚类分析……,…、……、…、二、……决策树……,…………遗传算法……支持向量机模糊集和粗糙集……数据挖掘的对象……基于切的数据挖掘……匕数据挖掘的模型……己数据挖掘的分类……己数……,……据挖掘的应用日志的数据挖掘……、二、二,、、……、…、、…………第三章聚类分析聚类概念……,……聚类……,……的数学模型常见的聚类算法……聚类方法的分类………聚类的有效性衡量…聚类的比较…………数据挖掘对聚类的要求第四章研触日志挖掘……匕日志……日志挖掘中的数据抽象……、…、…、,…、、……日志挖掘的通用模型……日志的预处理……场日志中的数据清洗……爬日志中的噪声数据的处理

3、……用户识别……会话识别……日志的聚类……,……日志聚类的分类……会话以及会话矩阵的表示……会话的相似度的定义……山东大学硕士学位论文,日志聚类特殊要求…………第五章日志挖掘模型……,日志挖掘模型的体系结构…………日志挖掘模型的具体的实现……日志的预处理…………,网页的聚类……,聚类分析的算法……,网页的推荐…………日志挖掘模型的试验结果……,……,第六章论文总结…………、……,参考文献………………致谢……在校期间发表的论文山东大学硕士学位论文摘要,,网络技术的发展特别是恻姗技术的兴起使得人们对于信息的获取更加的快捷和方便。但是这些新技术的使用同时也带来不少弊端,比如大家在

4、浏览网页,,时发现很难直接找到自己需要的信息而是相反的好像淹没在这海量的信息之中。数据挖掘的提出在很大程度上解决此问题。本文对于数据挖掘的定义、数据挖掘的任务、数据挖掘中的对象、数据挖掘的分析方法都做了很详尽的论述。数据挖掘最初主要使用在数据库上。但数据挖掘的对象并不局限于数据库,现在人,用来从们已经将数据挖掘的知识应用到了领域上网络信息当中挖掘出潜在的、有用的模式来。基于的挖掘又分为三类,对日志的挖掘是属于其中的使用挖掘。作为记录了人们访问情况的网络日志特别是服务器日志,因为其有着固,,。定的结构更容易进行挖掘而受到研究者的青睐本文就是在基于聚类的基础上探讨了日志挖掘中的

5、各种问题。首先从理论的,,角度对聚类领域进行了较为全面的探讨分析了聚类的基本模型聚类中常见算,,然后结合,法聚类的有效性衡量的方法了日志的具体的特点阐述了在日志挖掘对于聚类分析的特殊的要求。根据文献中己有的知识总结了日志挖掘的基本模型,详细的阐述了日志挖掘中的每一个阶段的内容及在日志挖掘中的地位。特别,“”“”,对于日志的预处理中的问题提出了日志的脏数据和噪声数据两个概念并且对这两个概念进行了详细的阐述并做了比较。这两个概念的提出使得日志挖掘模型的步骤更加的清晰可行。,。我们知道任何理论的最终目的都是应用于实践日志挖掘也不例外我们将日志挖掘得到的知识应用在了。,网页推荐上在

6、这一环节中我们提出了自己的打。新的打分,分函数函数综合考虑了多种因素对于用户未来访问的影响充分利用了我们上一阶段。,日志挖掘中得到的知识最后我们提出了具体日志挖掘的模型,将我们提出的这些理论应用在具体的模型中。通过,特别在真实日志中的表现是得出的各种数据进一步的证明了我们提出的各种想法的可行性和有效性。关键词日志挖掘聚类分析日志挖掘模型数据预处理网页推荐山东大学硕士学位论文,即罗汕,,,,而已,尽认乞,己,,已电而,己,如而,拟,而而山东大学硕士学位论文第一章绪论课题背景,、在当今互联网络的迅猛发展的背景下互联网已经成为了人们生产生活中不可缺少的一部分。而作为互联网技术中应

7、用最为成功的技术更是越来越同人们生活息息相关。技术已经从当初的简单提供文本信息发展成为今天的各种商业应用。诸如电子商务、网上教育、远程医疗等等的具体应用都发展的如火如茶。如,此迅速发展的网络对互联网技术的发展提出了更高的要求特别是使技术的改进和提高更加的迫切。如何合理的组织网站建设,如何更加人性化的给用户提供服务,如何从海量的网络信息中迅速的找到用户最为关,心的信息成为学者们越来越关心的课题。但是本身的无集中控制、无统一结构、无完整性约束、无事务管理、无标准查询语言和数据模型、可无限扩展松散的分布式特点,使得基于的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。