基于网页兴趣度的用户兴趣模型体系研究.pdf

基于网页兴趣度的用户兴趣模型体系研究.pdf

ID:51959223

大小:11.40 MB

页数:61页

时间:2020-03-20

基于网页兴趣度的用户兴趣模型体系研究.pdf_第1页
基于网页兴趣度的用户兴趣模型体系研究.pdf_第2页
基于网页兴趣度的用户兴趣模型体系研究.pdf_第3页
基于网页兴趣度的用户兴趣模型体系研究.pdf_第4页
基于网页兴趣度的用户兴趣模型体系研究.pdf_第5页
资源描述:

《基于网页兴趣度的用户兴趣模型体系研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、gii人7?硕丄令位论义接PM页兴趣嗖的用户%g投驴体系研%指导小组成员名单钱松荣教授焚旦大学硕ir#位论义B于网页兴趣度的用户%趣模m体系研宂目录觀

2、ABSTRACTIImi#绪论11.1研宄背景11.2研究内容31.3研宄现状51.4本文创新点61.5本文结构7第2章文本内容表征92.1弓

3、言92.2中文分词算法92.2.1中文分词算法思想102.2.2中文分词算法难点122.2.3中文分词算法实现132.2.4词性标注152.3文本表征算法162.3.1VSM模型基本思想162.3.2VSM模型的应用172

4、.4文本特征相似度算法192.5文本特征聚类算法202.5.1K-Means聚类算法212.5.2合并聚类算法212.6本章小结22第3章用户兴趣度量243.1弓I言243.2用户浏览行为分析253.3用户兴趣度量方法263.3.1用户浏览行为的兴趣度量273.3.2用户浏览时间的兴趣度量273.4本章小结30第4章用户兴趣模型314.1弓

5、言31fell大$硕上9位论乂基于M页兴趣度的用户兴趣投型体系研宂4.2兴趣模型的灰示314.2.1用户兴趣向量314.2.2用户兴趣矩阵324.3兴趣模型相关运算324.

6、3.1用户兴趣向量相关运算324.3.2用户兴趣矩阵相关运算334.4用户兴趣模型的建立344.5用户兴趣模型的更新344.5.1时间分段机制354.5.2时间衰减机制354.6用户兴趣模型的应用374.7本章小结38第5章用户兴趣模型系统395.1弓1?395.2系统架构395.2.1文本分析模块405.2.2兴趣提取模块405.2.3内容推荐模块415.2.4外部API模块415.3系统实现415.4系统验证455.4.1兴趣度量算法验证455.4.2兴趣模型算法验证465.5本章小结48第6章总结与展

7、望496.1成果总结496.2今后工作506.3未来展望50参考文献52攻读学位期间发表的学术论文55致谢56gH大学硕i:学位论文基于网页兴趣度的用户兴趣模麼体系研宂摘要进入Web2.0时代,博客、SNS、微博、轻博客、问答等新型互联网应用形式不断涌现,互联网上的信息量呈现了爆炸式的增长。相比之下,用户在特定时间感兴趣的内容相对有限,往往感兴趣的内容会被淹没在信息汪洋之中。搜索引擎是目前帮助用户找寻信息的最常用方法,它主要是通过用户输入的关键词进行字符匹配再配合一些优化算法来实现信息筛选。自从亚马逊的商品推荐服务推出带来了巨大成功之后,信息筛选的研究重点

8、被逐渐拓展到信息的智能推送上来。如何从海量数据中挖掘出用户感兴趣的内容,从而实现智能的个性化推荐服务,逐渐成为?了学术界和IT业界研宄的热门课题。用户兴趣模型是实现内容智能推荐的方式之一。它是指对于用户不同兴趣点的数学表示模型,通过分析用户的访问内容和浏览行为,提取出内容特征和用户对内容的感兴趣程度(InterestRate,简称IR),进而建立得到。兴趣模型建立之后,将现有内容与用户的兴趣模型进行比对,推荐与用户兴趣匹配程度最高的内容,实现内容的智能推荐。在内容特征提取方面,本文采用向量空间模型(VectorSpaceModel,简称VSM)来表征文章。在兴趣度评价方面,本

9、文提出了一种综合时间度量的用户行为评估算法,使得提取得到的用户兴趣更加贴近真实情况。在用户模型的更新方面,很多基于VSM的用户兴趣模型研宄者忽视了用户兴趣的漂移问题,对用户不同时间的兴趣不加区分,导致无法快速发现用户的兴趣变化,使得模型无法准确反映用户的最新兴趣;同时缺少更新机制,每次兴趣模型更新都需要对所有用户浏览记录进行统计,计算量庞大,数据存储代价高昂,这些都不便于兴趣模型的长期实际应用。针对这些问题,本文对以往的用户兴趣模型进行了优化,引入兴趣的时间分段机制和时间衰减机制以提高系统整体性能。本文基于用户兴趣模型的理论研究建立了一套兴趣模型系统,采集了来自新浪门户下世博

10、、曼联两个主题的2000篇文章来形成文章内容库。在系统运行过程中,持续收集用户的浏览操作、分析浏览行为、更新用户兴趣模型,最终根据兴趣模型给用户推送感兴趣的内容。经过观察和实验,系统能很好地体现出用户兴趣的变化,并且具有良好的性能稳定性,证明了本文提出的兴趣模型体系的正确性和有效性。关键字:用户兴趣模型,兴趣度,空间向量模型,时间分段,时间衰减中囹分类号:TP391.1复"人孕硕J¥仿论乂并于叫n兴趣度的mhr、趣投n,J体系研凡AbstractEnteringtheageofWeb2.0;theamo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。