基于用户访问序列挖掘的站点路径优化分 职称论文发表

基于用户访问序列挖掘的站点路径优化分 职称论文发表

ID:24101627

大小:50.00 KB

页数:3页

时间:2018-11-12

基于用户访问序列挖掘的站点路径优化分   职称论文发表 _第1页
基于用户访问序列挖掘的站点路径优化分   职称论文发表 _第2页
基于用户访问序列挖掘的站点路径优化分   职称论文发表 _第3页
资源描述:

《基于用户访问序列挖掘的站点路径优化分 职称论文发表 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于用户访问序列挖掘的站点路径优化分职称论文发表[摘要]由于X站的结构设计,对特定用户而言信息获取的代价与所经过的浏览路径长度成正比,这些位于路径中间的不必要的文档就无疑增加了用户获取信息的代价。本文利用PitoPi+1)addPitoB}∥Pi是一个回溯点;职称论文发表  If(Bnotempty)addn,B,Pn-1>totable;  通过该算法,就可以找到用户的返回点,这个位置可能是期望位置,也可能是目标页面,但可以通过确定时间阈值来解决这个问题。当用户在返回点停留的时间较长,超过指定的阈值,则

2、认为该页面是目标页面,否则可以认为该页面是期望位置。通常用户在浏览Web站点时,在第一期望位置找不到目标页面,就会在第二期望位置找,如果还找不到,会在第三期望位置找……,其中最受关心的是第一期望位置,而且是那些被第一期望且发生频率高于系统设计者指定值的所有页面。因此,寻找第一期望位置便成了我们关注的焦点[12]。  (2)目标位置和期望位置的判定。设Ei表示第一期望位置,算法如下:先以用户的ID为主关键字,时间为次关键字,对Web日志文件建立索引,扫描Web日志索引文件,对每一个用户ID,摘取出页面序列。  F

3、or(I=1;I<=1;I++)∥n为Web日志中的记录数  {统计Ei中所有页面支持数;  Sortpagebysupport;  Ifsupport(P)>=SI∥SI为Web设计者制定的阈值;  则P为被第一期望且发生频率高于系统设计者指定值的页面}  经过提取目标页面与期望位置之后,将形成如表1的目标页面与期望位置匹配集[13]。    (3)调整站点结构。根据该算法的挖掘结果,很多内容页面(目标页面)的实际位置与用户所期望的位置不一致,可以考虑依据这些目标页面的用户期望位置来调整目标页面

4、的实际位置。第一期望位置、第二期望位置……这些页面从某种角度看是围绕同一主题展开的,访问了其中部分页面的用户往往也会访问其他页面,因此可以在这些页面之间设置推荐链接。  3.3.2用户群访问模式的路径优化。对用户群访问模式的问题,采用挖掘频繁访问的最大序列的方法可以挖掘出更有普遍意义的模式,算法包括有Apriori算法,最大向前序列法,参考长度法和树形拓扑结构法等。它们先将日志中的用户浏览历史记录转换成一个浏览子序列集:最大向前序列法根据用户折返的特性形成若干浏览子序列;参考长度法根据用户在X页上停留的时间形成

5、若干个浏览子序列;树形拓扑结构法则把整个日志当作浏览子序列。然后利用关联规则法对浏览子序列进行挖掘找出频繁访问路径。频繁浏览路径就是指按照一定顺序组成的X页序列集,用户依照此序列访问X站的频度很高。  根据频繁访问路径算法得到频繁访问路径FP,对应记录为X(fp,np),其中fp表示URL组成的序列,np表示浏览路径集合中FP出现的次数[14]。  forallX∈FP  forallY∈FPandY≠X  ifX.fp∈Y.fp.subthenX.np=X.np-Y.np  ∥检查X.fp是否为另一记录Y.f

6、p的子序列  IfX.np>n  ∥n为预先设定的次数阈值  setSuplnik(X.fp)职称论文发表  ∥设计新的从X.fp起点指向终点的超链。  该方法可以用于重构Web站点的页面之间的链接关系,及重构Web站点的拓扑结构、发现相似的客户群体,开展个性化的信息服务和有针对性的电子商务活动,应用信息推拉技术构建智能化Web站点。    4结语  站点路径优化就是通过Web挖掘技术来收集和统计用户访问过的历史数据,挖掘当前用户频繁访问的页面序列,对个体用户获取其兴趣模型,以便在用户以后的访问过程中根据

7、兴趣模型自动向用户推荐内容,指导用户的浏览行为,提高浏览信息效率。对群体用户获取其访问路径规则与模式,通过增加超链改进站点结构,将页面加入缓存提高访问速度,提高用户对站点访问的满意度[15]。访问规律的获取对算法提出了较高的要求,可以借鉴现有模式发现算法实现浏览结构的优化。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。