欢迎来到天天文库
浏览记录
ID:31360580
大小:112.00 KB
页数:8页
时间:2019-01-09
《基于用户多页面浏览模式下的网络结构推荐系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于用户多页面浏览模式下的网络结构推荐系统的研究 摘要:针对用户普遍使用的多页面浏览器产生树型结构的浏览路径,web日志中将会呈现非时序的日志记录。本文提出了一种新的自上而下的用户访问路径收集算法,进而得出的用户在一次会话中可能访问的复数目的页面,由此得出全局目的页面访问频度矩阵,此矩阵的数据作为实现基于网络结构的推荐系统的核心数据。 关键字:访问路径树形;推荐系统;网络结构 中图分类号TP274文献标识码A Researchonnetworkstructurerecommendationsystembasedo
2、nmultipagebrowsingmode ZHULifu1,LIUXiangdong1 1(ChangshaFurongRegionPeople'sProcuratorateTechnicalDepartment,Changsha410016,China) Abstract:Browsingpathforthetreestructureofmultipagebrowserwhichiswidelyusedbyusers,theweblogwillshownonsequentiallogrecords.Thisp
3、aperpresentsanewtop-downuseraccesspathcollectionalgorithm,andthencometothecomplexpageauserinasessionmayvisit,resultinginaglobalpageaccessfrequencymatrix.Thismatrixdatacouldbeusedascoredatabased8ontherecommendationsystemfromthenetworkstructure. Keywords:accesspat
4、htree;recommendedsystem;networkstructure 0引言 在Internet电子商务网站中,客户在网站上的每一次点击,作为网站后台的Web服务器都会将这个动作如实地记录在日志中,这为分析用户访问频率、用户访问路径、用户访问目的等信息提供了数据来源。通过分析Web浏览日志,发现用户的访问模式,提取用户的访问兴趣,将得到的各种用户信息进行整合研究,从而生成有效的决策信息,即可为用户提供个性化推荐,同时还能进一步优化网站的拓扑结构。当前数据挖掘技术与Web日志分析已经实现了优质紧密结合。其中
5、,Chen等人在1996年提出了可以将数据挖掘技术应用到Web领域中的思想,并且探讨基于Web事务的Web日志挖掘过程,用以发现用户的访问模式,由此又定义了最向前引用算法MF的概念。Zaiane等人则将Web服务器日志保存为数据立方体(DataCube),然后对数据立方体进行数据挖掘和联机分析处理(OLAP)。而实现这些算法的前提是从Web日志中探究会话识别,并分离出用户会话,进而提炼出用户访问路径。针对用户普遍使用的多页面浏览器产生树型结构的浏览路径,Web日志中将会呈现非时序的日志记录。基于此,本文提出了一种新的自上
6、而下的用户访问路径收集算法,运行得出用户在一次会话中可能访问的复数目的页面,由此得出全局目的页面访问频度矩阵,该矩阵的数据将可作为实现基于网络结构的推荐系统的核心数据。 1基于多页面浏览模式的用户访问路径的收集算法8 用户访问路径树,指用户通过多页面浏览器访问模式浏览网页形成的网页访问路径。其中定义用户浏览网页的记录集,属性包括会话编号、用户编号、用户访问资源、用户引用页面、以及其他相关信息。具体来说,集合中就是经过数据预处理中的会话识别后得到的结果记录,其他信息则是根据需要添加的不同信息,比如页面大小,访问时间等等
7、。此外,还需定义树的节点,内容包括用户编号、用户访问资源、孩子集合等。 在对Web日志数据进行去除冗余信息,用户识别、会话识别的预处理后,算法将自上而下地搜索用户会话记录,重点关注了记录中的用户访问资源、引用页面和用户信息等属性。该主题算法的基本思想为:首先从单个会话记录的顶部发起搜索,通常第一条记录为用户访问的初始页面或者是从其他网站跳转过来的页面,此页面就会作为新建用户浏览树的根节点。继续向下展开记录搜索过程,对记录进行分析,考察记录的引用页面,是否为先前已建立的树的节点。如果是,则加入树模型中;如果不是,即以此记
8、录的访问页面为根节点,再建一棵用户浏览路径树。直到将此会话记录全部搜索完毕,算法执行结束。 以图1所示的用户浏览情况为例算法的识别过程如下。 如图1所示,首先搜索第一条记录,把A节点作为用户浏览树的根节点。继续向下搜索记录,搜索到B页面所对应的记录。考察此记录的引用页面,引用页面为A页面,将B页面作为A页面的子节
此文档下载收益归作者所有