数据挖掘技术论文网络服务构建论文

数据挖掘技术论文网络服务构建论文

ID:9044782

大小:32.50 KB

页数:6页

时间:2018-04-15

数据挖掘技术论文网络服务构建论文_第1页
数据挖掘技术论文网络服务构建论文_第2页
数据挖掘技术论文网络服务构建论文_第3页
数据挖掘技术论文网络服务构建论文_第4页
数据挖掘技术论文网络服务构建论文_第5页
资源描述:

《数据挖掘技术论文网络服务构建论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘技术论文网络服务构建论文数据挖掘技术现代网络服务系统构建研究  摘要:针对当前网络服务构建过程中出现的问题,提出了基于数据挖掘技术的网络服务系统模型,提出了系统的功能,达到根据用户当面访问行为,分析用户模式,动态为用户推荐页面,具有一定的应用价值。  关键词:数据挖掘;网络服务;数据预处理;关联规则  1绪论  近年来,随着Internet技术和Web网络服务技术的迅速发展,网络已经成为一个巨大的、全球性的信息服务中心。随着网络服务信息量的迅速增长,传统的客户页面访问模式已经不适应客户的要求。针对这些问题,很多大型的网络服务提供商推出了个性化网络服务方式,提供不同服务策

2、略和服务内容的服务模式,提前收集网络用户信息,分析用户行为和兴趣等,进而提供满足用户需求的网络服务。在现代网络服务构建过程中,往往面临网络服务数据量过大,用户信息收集困难等问题,解决这些问题的最有效的方法就是将数据挖掘技术应用到现代网络服务构建中。通过数据的有效挖掘,可以更好的了解用户兴趣,分析用户的访问模式,根据用户的个性需求,为用户实时提供推荐页面。  2基于数据挖掘的现代网络服务系统结构及功能  2.1系统结构  进行Web数据挖掘的研究主要是为了将知识发现的结果应用到实际中,为科学决策提供支持。因此将Web数据挖掘运行在网络服务系统的用户数据库和数据仓库之上,根据Web

3、数据挖掘个性化服务系统的作用及Web数据完决的一般流程,可创建一种基于数据挖掘的现代网络服务系统框架,如图1所示。该系统模型是基于关联规则挖掘思想,通过预处理获得的用户事物数据,采用改进后的频繁模式挖掘算法,发现用户的频繁访问路径,然后根据用户当前请求的页面,寻找匹配的模式,从而预测用户下一步要访问的页面,动态的提供页面的链接,使用户能够方便、快捷地找到自己所需要的内容。  2.2系统功能  现代网络服务系统信息收集部分可获取用户访问站点的所有信息,根据用户访问信息完成完挖掘操作。然后当用户再访问站点时,网站从挖掘模型进行调整,用户访问的将是调整后的新服务页面,网络服务运行的整

4、个周期中,此过程不断反复运行。图1可以得出整个服务过程基本符合数据挖掘的一般过程,整个系统的运行由网络管理者通过与用户交互进行控制,整个系统功能可以分为以下三个方面:  (1)数据准备阶段。  数据准备模块是该模型的基础阶段,主要包括数据采集和数据预处理两个处理流程,具体如图2所示:  数据采集阶段首先将访问数据读入到关系数据库中,然后对数据进行预处理,转换为适合数据挖掘的可靠数据。将服务器上的日志文件中无用和无关的数据进行清理和合并后进行用户识别和会话识别。数据预处理操作是进行挖掘的关键问题,数据准备阶段是整个系统的基础。  (2)事务挖掘模块。  事务挖掘模块是整个系统的核

5、心部分,面向用户及Web站点的服务方,她可以根据用户的需求通过传递参数的方式,调用相应的模式挖掘算法,对前面得到的事务数据库进行挖掘,分析用户的浏览兴趣。在进行模式挖掘时可采用的算法包括关联规则挖掘算法,用户聚类挖掘算法、用户分类挖掘算法以及序列模式挖掘算法等。本系统主要采用关联规则挖掘技术,挖掘用户事务中的强关联规则,并通过频繁访问模式挖掘算法挖掘用户频繁访问路径。该方法比较适合于站点访问用户比较多,新用户比较少的站点中,具有快速、准确的特点。因此在挖掘模块中要解决信息、规则库动态更新的问题,为用户提供更好的、动态的现代网络服务系统。  (3)实时监控模块。  实时监控模块对

6、用户的访问行为进行监视,对用户下一步的操作行为进行在线预测。主要根据用户当前操作比对模式库,分析得出用户的使用模式信息,动态调整站点的显示内容和显示方式,将生成的推荐页面集合预送给用户,为用户提供个性化服务。监控模块的调整实现方式主要有:分析预测用户感兴趣的页面,增加链接的方式将这些页面的连接推荐给用户,调整站点结构以尽量缩短用户的访问路径,将浏览的路径以明显的形式提示用户。对用户使用模式的分析结果是网站结构进行再调整的重要依据,根据用户访问兴趣,调整网站现有的网页链接关系,有助于提高用户的访问效率。  3关联规则在现代网络服务系统中的应用  3.1频繁访问模式挖掘  通过Ap

7、riori算法及其改进算法可以挖掘出数据库中的关联规则,但其挖掘对象主要是针对数据库中的无序数据。而在通过Web数据挖掘发现用户频繁访问模式时,挖掘对象是用户有序的页面访问路径,页面之间顺序不能颠倒,因此在进行频繁访问模式挖掘时和以往的挖掘算法有所区别。在Web数据预处理的基础之上已经生成了用户事务集合,通过最大向前引用路径方法识别的用户事务其实就是一个MFP。频繁遍历路径是指包含在MFP集合中满足一定支持度的连续页面序列。频繁遍历路径通常也称为频繁访问模式,而发现频繁访问模式的过程就是发现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。