用户兴趣模型在垂直搜索引擎检索模块中的应用

用户兴趣模型在垂直搜索引擎检索模块中的应用

ID:9669161

大小:49.50 KB

页数:2页

时间:2018-05-05

用户兴趣模型在垂直搜索引擎检索模块中的应用_第1页
用户兴趣模型在垂直搜索引擎检索模块中的应用_第2页
资源描述:

《用户兴趣模型在垂直搜索引擎检索模块中的应用》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、用户兴趣模型在垂直搜索引擎检索模块中的应用用户兴趣模型在垂直搜索引擎检索模块中的应用 0引言  搜索引擎作为网络信息查询的主要工具已经在人类生活中占据了主导地位,搜索引擎的搜索质量直接影响到用户体验。垂直搜索在专业性上略胜与传统的搜索引擎。本文主要改进垂直搜索引擎的检索模块,在传统的Lucene检索模块中加入Pagerank得分,关键词得分,并特别加入了用户兴趣得分,建立了一个个性化的垂直搜索检索模块模型,从而使垂直搜索在个性化上更贴近用户的使用习惯和兴趣。  1用户兴趣模型的建立  用户兴趣作为垂直搜索引擎当中的一项个性化服

2、务,直接影响到了用户使用该垂直搜索的体验[1]。用户兴趣模型的建立应从两个方面分析:一是用户兴趣模型能否反映用户的真实兴趣爱好;二是针对用户查询兴趣的多变性,该模型是否能满足变化的用户兴趣。  1.1常用的用户建模技术  现今的用户建模技术分为三类:用户手工定制建模、示例用户建模和自动用户建模。  ⑴用户手工定制建模  用户自己动手在网页上选择或者手动输入自己的兴趣爱好。该方法实现简单,得到的用户兴趣结果可靠。但是存在不足:①影响用户体验,一般用户对频繁的输入和选择缺乏兴趣;②更新用户模型困难,一旦用户的兴趣发生转移,而又让用

3、户重新提交网页文档会给用户造成负担;③反映用户兴趣不全面,提供给用户的选择项本身就带有主观性,另外用户选择时也存在不能准确表达的情况,这些将直接导致收集的用户兴趣不够准确[2]。  ⑵示例用户建模  示例用户模型的建模是用户自己提供相关的兴趣爱好示例及其类别属性。用户在浏览网页时标注对页面的感兴趣程度即可得到用户建模的示例。  ⑶自动用户建模  通过留意用户浏览网页的内容和浏览网页时的行为自动为用户构建一个用户模型[5],这种建模无需用户主动参与,通过用户上网时的行为采用数据挖掘技术自动获取用户的兴趣爱好。虽然这种方法会带来一

4、定的噪声,影响用户浏览时的速度,对建立高质量的用户模型也有一定的影响,但是该方法无需用户主动提供信息,不干扰用户的其他操作,从用户体验的角度来说是比较好的建模方法。因此,未来建模技术的发展方向都会采用自动建模技术。  1.2用户兴趣行为的量化表示  通过对自动用户建模的相关研究发现,用户的兴趣与用户的行为是紧密相连的。用户兴趣可以通过用户浏览该页面的时间和拖动滚动条的时间来有效地反映。而通过用户阅读页面平均速度能帮助建模时确定用户兴趣的等级。另外用户查询、标记书签、浏览页面、点击鼠标、反馈信息、拖动滚动条、后退、前进等这些行为

5、都可以暗示用户的爱好。用户访问页面时的停留时间、访问次数、保存、编辑、修改等动作都能够揭示用户兴趣[3]。  通过以上分析,将用户行为用二维表格来记录,称用户行为数据表[3]。数据表又分为两种类型:基于关键词的用户行为数据表和基于文档的用户行为数据表。前者描述用户在关键词上的行为,其结构如表1所示;后者描述用户在一篇文档上的行为,其结构如表2所示。 表1中的数据为:用户id号(uid)、关键词(ke)、在该文档中添加书签的数目(bmk)、批注次数(ant)。  由于浏览时间受一些客观因素的影响,因此以上时间是修正后的时间。  

6、1.3用户兴趣度的计算  由于用户在浏览网页的过程中有自己固定的爱好和使用方法,本文由.L.收集整理,因此可以针对不同的用户用不同的权重值来表示用户的不同行为[4]。  ⑴基于关键词的用户兴趣计算  用户行为权重,  ,表示用户对某主题下n个关键词的行为。两者的乘积定义为:  ks左右,而改进的搜索平均响应时间在46ms左右。  两种检索在三个方面得到的结果对比如表3所示。  4结束语  本文主要改进了垂直搜索引擎的检索模块,在该模块中综合了主题相关度得分、网页重要性得分、用户兴趣计算得分、关键词位置权值得分四个方面来计算网页

7、文档得分。特别将用户兴趣得分部分设置了较重的权重值,使得本文的垂直搜索更具有个性化。通过实验证明,该模型从用户的角度提高了搜索质量,改善了用户体验。该模型还存在一定的局限性,在权重值的分配上还需要大量的实验来验证更合理地分配方案,以达到更合理的搜索效果。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。