基于行为分析的用户兴趣建模

基于行为分析的用户兴趣建模

ID:4124950

大小:438.97 KB

页数:7页

时间:2017-11-29

基于行为分析的用户兴趣建模_第1页
基于行为分析的用户兴趣建模_第2页
基于行为分析的用户兴趣建模_第3页
基于行为分析的用户兴趣建模_第4页
基于行为分析的用户兴趣建模_第5页
资源描述:

《基于行为分析的用户兴趣建模》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据166基于行为分析的用户兴趣建模AUserInterestModelBasedontheAnalysisofUserBehaviors许波张结魁周军(合肥工业大学管理学院电子商务研究所合肥2姗)摘要了解用户的兴趣是网站实现个性化的基础。为了更好地为用户提供个性化服务,在分析用户的浏览行为特征的基础上,根据用户在页面中的滞留时间,用户对页面中的超文本链的点击情况以及页面的点击频率建立了计算用户兴趣度的模型,并提出用神经网络模型来描述它们之间的相关性。且通过实验论证了这种模型的合理性和有效性。实验结果表明这种模型能比较准确地发现用户感兴趣的页面。关键词个性化用户浏览行为用户

2、兴趣度RBF网络中图分类号TPl83文献标识码A文章编号1002—1965(2009)06一0166一04随着互联网技术在全球的应用和发展。网络正在各个方面影响着人们的工作和生活方式。然而,现有的信息服务系统存在着明显的缺陷,比如资源分散,检索集中,对于所有用户提供的信息都是相同的,有求则应。无求不动。对于普通用户来说.Intemet上的“信息迷航”和“信息过载”已经成为日益严重的问题。解决这些问题的关键在于将Internet从被动接受浏览者的请求转化为主动感知浏览者的信息需求⋯,实现In.ternet系统对浏览者的个性化主动信息服务。为了实现个性化服务,首先需要跟踪和学习用户

3、的兴趣和行为,刻画用户的特征与用户之间的关系。根据浏览行为或浏览内容来分析、捕获用户兴趣是目前个性化服务研究的一个重要方向旧J。径向基函数(RadialBasisFunction,RBF)神经网络以其深厚的生理学基础、简单的网络结构、快速的学习能力、优良的逼近性能,在网页个性化推荐中也得到了良好的应用bJ。本文给出一种通过对用户浏览行为的分析来计算用户对网页的兴趣度的方法,抓住几个重要特征描述了用户浏览行为,并用RBF网络模型来描述它们之间的相关性。1用户访问行为的特征提取大量研究表明,用户对网页的兴趣度与其在该网页上的浏览行为密切相关。用户访问一个站点,通常带有某种喜好,不同

4、的用户间有不同的兴趣爱好。用户的访问路径中蕴藏了用户对于站点的兴趣及用户兴趣的转移。文献[4]指出,用户的很多动作都能暗示其喜好,如查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等。文献[5]的研究指出。用户访问时的停留时间、访问次数、保存、编辑、修改等动作能够揭示用户兴趣。但是,在这些文章里并没有对哪些行为究竟如何反映用户的兴趣进行量化估算。从表面上看,能够揭示用户对网页的兴趣度的浏览行为很多,但我们分析发现,起关键作用的有三种行为:在网页上的浏览时间(浏览行为以特定的时间间隔进行划分,使用聚类的方法,建立一个个性化推荐模型【6】),在某页面下点击

5、的链接(通过收集用户浏览行为的信息。通过一定的机制来预测用户的下一步行为,计算网页权重,并做页面的推荐[4】),某个页面的点击频率(用户在使用浏览器时如何使用标记和收藏,来进一步分析用户的浏览和搜寻行为一J)。原因有三个:a.查询、编辑、修改等行为必定增加网页浏览时间和翻页次数(由于翻页后定位的仍然是同一个URL。故表现出来的仍然是增加网页浏览时间),因此能够通过网页浏览时间间接地得到反映。b.执行了保存、标记书签等动作的页面,若真为用户所关心,通常以后会被多次地调出来重新浏览,故可体现访问次数。c.用户检索收稿It期:2008—12—20修『nlH期:2009—03一05基金

6、项H:国家自然科学基金项目“基于网络消费者信息需求模型的网站导航问题研究”(编号:70672097);国家自然科学基金重点项目“群决策理论与方法研究”(编号:70631003)。作者简介:许波,男,1984年生,硕士研究生,研究方向为数据挖掘、社会性网络;张结魁,男,1974年生,博士研究生,研究方向为网络消费者行为;周军,男,1984年生,硕士研究生,研究方向为数据挖掘。万方数据·167-时如果是基于站点的,而且站点中存在的让用户感兴趣的链接越多,用户相应点击的链接也越多,则该页面越重要。1.1根据用户在页面中的滞留时间来确定页面权重的方法假设用户所访问的一个页面P中有7"/

7、个超文本链接,其中用户访问过的超文本链分别是{H,,H2,⋯,H},在其中逗留的时间为{丁l,T2,⋯,t},并且丁(P)表示页面P根据用户的滞留时阊所得到的权重。设口表示在当前页面用户滞留的有效时间,则计算页面的权重的递归公式为:丁(P)=口+∑(t/以)(1)该公式考虑到了子节点具有父节点的一些特征.有的子节点更是父节点的一个具体的实例,因此对子节点兴趣强度增加,可看作对其父节点兴趣强度有所贡献。事实上,浏览网页的时长与网页的信息总量也是密切相关的。考虑到这种情形以上公式可以改为:T㈣=

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。