欢迎来到天天文库
浏览记录
ID:34821984
大小:3.75 MB
页数:78页
时间:2019-03-11
《浅议个性化服务中用户兴趣模型的研究与设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号密级UDC编号桂林电子科技大学硕士学位论文题目个性化服务中用户兴趣模型的研究与设计(英文)TheResearchonandtheDesignofUserinterestModelinPersonalizedService研究生姓名:李春妍指导教师姓名、职务:王勇申请学位门类:工学硕士_学科、专业:计算机应用技术提交论文日期:2007年4月论文答辩日期:2007年6月年月日万方数据独创性(或创新性)声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的
2、研究成果;也不包含为获得桂林电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期:关于论文使用授权的说明本人完全了解桂林电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属桂林电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为桂林电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复
3、制手段保存论文。(保密的论文在解密后遵守此规定)本学位论文属于保密在____年解密后适用本授权书。本人签名:日期:导师签名:日期:万方数据摘要摘要随着网络信息的高速增长,为了解决信息过载和信息迷航所带来的种种问题,个性化服务已经成为信息领域研究的热点之一。个性化服务针对不同的用户采取不同的服务策略,提供不同的服务内容,用户兴趣建模是其关键技术之一。用户兴趣模型能否准确地反映用户的兴趣决定了系统提供个性化服务的质量。本文针对用户兴趣建模进行了以下几方面的研究:首先进行数据的采集。系统隐式地收集用户浏览页面和浏览行为作为用户兴趣建模的主要数据来源,在对页面进行预处理,抽取
4、页面内容后,采用本文提出的适用于中文文本聚类的单文档特征提取方法——基于综合指标的特征提取方案来提取页面的特征向量。其次,本文讨论了用户兴趣聚类的特殊性,指出了经典聚类方法应用于用户兴趣聚类时的不足,在基于图论的NEOREN算法基础上进行实验改进,提出了基于相似度阈值的聚类算法,实验证明,该算法能够显著提高聚类质量,有效区分孤立点,适用于用户兴趣聚类。接着,本文采用细兴趣粒度与向量空间模型相结合的表示方法,并在此基础上进行扩展,给出了用户兴趣模型的形式化表示。在用户兴趣聚类分析的基础上创建用户兴趣模型;结合活跃度、关注度、遗忘因子对模型进行更新,生成长、短期兴趣;并给
5、出了该模型应用于个性化服务时的推荐算法。最后进行全面的模拟实验,通过实验分析表明,本文提出的用户兴趣模型能够比较全面的描述用户兴趣,准确地跟踪用户兴趣变化,具有良好的效率。关键词:个性化服务,用户兴趣模型,特征提取,文本聚类,向量空间模型I万方数据ABSTRACTAbstractWiththeexplosivegrowthofinformationavailableontheInternet,personalizedservicehasbecometobeafocusresearchinthedomainofinformationservicetodealwithth
6、eproblemofinformationoverloadingandinformationamazing.Personalizedserviceistogivedifferentservice-strategyanddifferentservice-contenttodifferentuser.Howtoconstructuserprofileisoneofitscoretechnologies.Therefore,thequalityofpersonalizedinformationserviceprovidedbythesystemisdeterminedbyt
7、hefactwhetherornottheuserprofilesreflectuserinterestsexactly.Thispaperplanstomakeastudyfromthefollowingaspectsaboutuserinterestmodeling:First,thesystemcollectstheuser’sbrowsingcontentandbehaviorasthemaininitialdatainimplicitway.Thecontent,obtainedbycleaningthewebpage,isbeenexpr
此文档下载收益归作者所有