欢迎来到天天文库
浏览记录
ID:30621354
大小:17.06 KB
页数:3页
时间:2019-01-01
《个性化推荐服务中用户兴趣模型研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果个性化推荐服务中用户兴趣模型研究采用向量空间模型表示的数据,必须选择计算两个特征矢量之间相似性的相似度函数。现在常用的方法有欧几里德距离、曼哈坦距离和夹角余弦函数。我们在这里采用夹角余弦函数。但是在计算时可能会遇到用于比较的两个特征矢量长度不一样,我们可以采用添零补齐的方法使两者长度一致。夹角余弦函数如下:其中,C表示页面X与Y的相似度,与表示X与Y对应的特征词的权值。页面X与Y值越相似,C值越大;反之则越小。3基于浏览行为的
2、用户兴趣分析研究表明,用户很多浏览行为都能很好地反映用户的兴趣。文献[6]指出用户的很多动作都能暗示用户的喜好,如查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等。文献[7]的研究指出用户访问时的停留时问、访问次数、保存、编辑、修改等动作能够揭示用户兴趣。这些行为究竟怎样反映用户的兴趣,我们需要对其进行量化估算。.1浏览行为的分类从表面上看能揭示用户对网页P兴趣度d的浏览行为很多,但我们分析发现,起关键作用的是两种行为:在网页P上的浏览时间t和翻页/拉动滚动条的次数v。课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在
3、一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果原因有三:1)查询、编辑、修改等行为必定增加网页浏览时间和翻页次数,因此能够通过后者间接的得到反映。2)执行了保存、标记书签等动作的页面,若真为用户关心,通常以后会被多次调出来重新浏览,故可体现为访问次数。3)点击鼠标动作不被考虑,因为简单动作不能有效揭示用户兴趣。.浏览行为参数的计算为了找到T,V与网页兴趣度的定量关系,通过分析和实验,决定采用一元线性回归方法作为网页兴趣建模
4、分析的工具。线性回归分析方法是在分析研究对象变化趋势的基础上建立函数模型,从而研究对象之间存在的相互依存关系。聚类就是将数据对象分组成为多个类或簇,在同一簇中的对象之间具有较高的相似度,不同类中的对象差别较大。我们将层次聚类算法和k-means聚类算法相结合起来,利用层次聚类算法来产生k-means聚类算法所需的k值和初始聚类中心。这样大大提高了k-means聚类算法的性能,能更准确地发现用户的兴趣所在。改进的k-means二次聚类算法描述如下:输入:包含n张页面的特征向量表示矩阵C;输出:一个已经分好类的用户兴趣树T;算法:1)将C作为兴趣树的一个最大类,
5、令T=C;)C作为一个类;)m=m+1;)特征向量矩阵C中的每一行对象看作是一个具有单个成员的类,这些类构成了D的一个聚类C=;)计算C中每对类之间的相似度sim;)设定一阀值,选取具有最大相似度的类对值,如果max≤,将和合并为一个新的类,从而构成了D的一个新的聚类C=,重复步骤(5),(6);如果max>,凝聚算法结束,得到分为k个子类的聚类C=;)将k和C={c1,c2,...,ck}分别作为课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和
6、理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果k-means聚类要生成的簇的数目参数和初始聚类中心,执行k-means聚类,得到修正后的k个类;)把k个类的作为初始类的子类;)对于每一个,令,如果δ5结束语随着Internet的发展,个性化服务技术显的愈发重要。用户兴趣模型建立的准确与否,直接决定着个性化服务质量的好坏。本文通过对用户浏览的Web页面进行兴趣度分析和对用户浏览行为分析相结合,得到用兴趣分类树表示的用户兴趣模型。由于采用的是隐式创建用户描述文件的方法,减少了因用户参于而带来的系统噪声,保证了所创建的用户兴趣
7、模型的准确性。参考文献[1]丁浩,林云.Internet上的个性化信息服务.中国计算机报.[2]曾春,刑春晓,周立柱.个性化服务技术综述[J].软件学报.,,XX.[3]唐倩,张前,陈泓婕.基于Web的文本挖掘[J].计算机工程与应用,XX,21.[4]鲁松,白硕.文本中词语权重计算方法的改进[J].XXInternationalConferenceonMultilingualInformationProcessing,000:31-36.[5]高晓琴,蒋朝学,涂瑞.Web使用挖掘研究.微计算机信息,XX,21.[6]史忠植著,知识发现.清华大学出版社.XX
8、.[7]谭琼,李晓黎,史忠植.一种实现搜索引擎个性化
此文档下载收益归作者所有