基于Web的数据挖掘在网站个性化服务系统中的应用.pdf

基于Web的数据挖掘在网站个性化服务系统中的应用.pdf

ID:52351796

大小:180.92 KB

页数:3页

时间:2020-03-26

基于Web的数据挖掘在网站个性化服务系统中的应用.pdf_第1页
基于Web的数据挖掘在网站个性化服务系统中的应用.pdf_第2页
基于Web的数据挖掘在网站个性化服务系统中的应用.pdf_第3页
资源描述:

《基于Web的数据挖掘在网站个性化服务系统中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于Web的数据挖掘在网站个性化服务系统中的应用罗盂(钦州学院物理与材料科学学院,广西钦州535000)[摘要】采用基于Web的数据挖掘技术从网络上提取潜在未知的数据信息。具有非常重要的现实意义和很好的应用前景。详细探讨了基于web的数据挖掘在网站个性化服务系统中的应用。[关键词]web数据挖掘;网站个性化服务系统;应用1.引言基于Web的数据挖掘将数据挖掘的思想和方法应用到Web上,在富含丰富的信息的Internet上挖掘出隐含的、未知的、非一般的以及有潜在的有用的信息。通过基于Web的数据挖掘,可以建设能够提供个性化服务的网站,而且可以在Web上进行交易。2.基于W

2、eb的数据挖掘概述所谓基于Web的数据挖掘,是指利用数据挖掘技术从含有丰富的信息的网络中挖掘出隐含的、未知的、非一般的以及有潜在的有用信息的过程,从而为用户提供个性化的服务,同时满足网站经营者获得更多利润的要求。3.基于Web的数据挖掘在网站个性化服务系统中的应用3.1网络浏览行为模式分析用户对于网站的浏览行为包括在某个页面上面的停留时间、刷新页面的频率等,这些行为都有许多潜在的访问偏好信息,能够表示用户的个人偏好。通过用户的浏览行为,能够加深对于用户的了解,同时为用户提供个性化服务。利用网站存储的历史记录能够分析网站的性能,改变网站的布局以适应用户需求,分析用户的浏览

3、行为。只按照用户访问某一个页面的频率的大小去判断这个页面受用户关注的程度的大小,是一种非常不适合的方法。而利用网站存储的历史记录,了解用户的访问行为,是非常有依据的,这是一种非常适合的方法。此外,在基于Web的数据挖掘的分析方法中,对于用户的浏览行为分析,使用关联规则的方法是非常普遍的。所谓关联规则,就是多种事物之间的发生存在着一定的关联,也就是说存在着各种各样的联系,一件事情的发生会影响到另外一件事情的发生。下面举例阐述关联规则的使用。设I_{iI,i2,⋯,im}为n1个不同项的属性集,事物T为I的子集,不同事物的集合,构成数据库D,关联规则的形式为:X号Y,其中x

4、cI,YcI并且xnY=中。若干项的集合组成项集,它有一个统计度量称为支持度,对于项集xcI,支持度表示从D中任取一事物包含x的概率,其定义如下:Support(X)=I{T∈DlX∈TI/

5、DI其中,I·l表示集合中的元素个数。规则的支持度与置信度分别定义如下:Suppon(xjY)=Support(XUY)Confidence(XjY)=Suppon(XUⅥ/Support(X)以一个电子商务购物网站为案例进行分析,对于一种产品的用户有如下的关联规则:<年龄:25.49>并且<收入:500.1999元>==><购前了解渠道:报纸>并且<置信度:60%>并且<支持度:

6、20%>它表达了这样一个信息:在该产品的主体用户群中(年龄在:25.49并且收入在:500.1999元之间并具有占到调查用户的200/,),在购买前主要(60%)是通过报纸了解该产品的。通过这个结论可以清楚地知道该产品的主要消费群体的一些特征,这对企业在作未来市场的决策中起非常重要的作用。基于Web的数据挖掘技术中的关联规则挖掘,就是从众多各种各样的数据中,找出一定的关联规则。3.2研究流程本文的研究重点就是使用上面提到的关联规则的分析方法,对于用户的浏览行为进行分析,求得用户的浏览路径,并找出用户期望的目标网页。在本研究中,通过查看网页服务器的浏览记录,进行用户偏好分

7、析和网页关联性分析,再根据用户偏好的目标网页,进行关联分析,推荐与该目标网页具有高度关联性的网页,最后根据推荐前后用户的网页浏览记录,比较被推荐网页的浏览序列的长度,从而验证推荐的正确性。如图l所示是研究流程。开始卜——-叫闩愿定义卜——_.叫教据过滤卜—叫用户僖好分析结束卜●—一推荐结果验证扣●—一相关同页推荐—H罔页关联性分析作者简介:罗孟.男.广西北流人。本科,助教。研究方向:数据库及其应用技术。一60一圈1研究流程图为了建立一个有效的网站个性化服务系统,为用户提供良好的个性化服务,本研究根据服务器中的网页浏览记录,结合用户的浏览行为偏好,进行关联规贝0的分析。3

8、.3实验资料与实验结果实验网站选择计算机学习网站。首先,从网站的服务器中查询出本实验网站用户的浏览记录,存放在SQLSERVER2000数据库中,总共有2000条。然后,设定下面的限制:(1)时间限制:2009年七月份的浏览记录。(2)用户限制:网页访问次数高于8的用户。(3)兴趣度限制:在页面上的停留时间高于15秒。通过上面的限制条件,将存放在SQLSERVER2000数据库中的浏览记录进行过滤,留下600条记录。再进行个性化的用户偏好分析,得到用户偏好的目标网页。如表l所示:裹1用户偏好的目标网页类别用户D目标网页lUset01,Us

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。