基于web挖掘的个性化推荐模型的研究

基于web挖掘的个性化推荐模型的研究

ID:33326671

大小:194.00 KB

页数:7页

时间:2019-02-24

基于web挖掘的个性化推荐模型的研究_第1页
基于web挖掘的个性化推荐模型的研究_第2页
基于web挖掘的个性化推荐模型的研究_第3页
基于web挖掘的个性化推荐模型的研究_第4页
基于web挖掘的个性化推荐模型的研究_第5页
资源描述:

《基于web挖掘的个性化推荐模型的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于Web挖掘的个性化推荐模型的研究曹雷1杜辉锋21)解放军理工大学指挥自动化学院作战软件教研室南京2100072)解放军理工大学指挥自动化学院研究生2队南京210007摘要:提出了一种新颖的个性化网页推荐模型。它基于挖掘Web日志记录,同时融合了信息检索和信息过滤的相关技术。运用概率分布模型来表达文档和用户兴趣,并且通过聚类生成群体兴趣扩展了个体兴趣。同时阐述了用户兴趣文件建立、维护和个性化推荐。实验证明了推荐模型的准确性和有效性。关键词:个性化推荐;数据挖掘;群体兴趣;聚类ResearchofRecommendationModel

2、inPersonalServiceBasedonWeb-miningLeiCao1,HuifengDu21)OperationalSoftwareDepartmentICA,PLAuniversityofScienceandTechnology,Nanjing2100072)postgraduateTeam2ICA,PLAuniversityofScienceandTechnology,Nanjing210007Abstract:Anewrecommendationmodelinpersonalservice,whichintegra

3、tesinformationretrievalandinformationfilteringtechnologybasedonminingofWeb-logisproposed.Weapplythemodelofprobabilityfeaturetorepresentuserinterestandfile.Atthesametime,weextendsingleuserprofilebasedongroupinterest,clusteringfromtheallusers’interest.Atlast,thissystemcon

4、stitutesandmaintainsusermodeltoimplementpersonalrecommendation.Theexperimentresultindicatesthismodeliseffective.Keywords:RecommendationinPersonalService;Data-mining;GroupInterest;Clustering随着国际互联网的迅速发展,网络信息资源呈爆炸性增长,人们已经被包围在信息的汪洋大海之中,要准确、快速地查找自己所需的信息已变得越来越困难。因而人们迫切渴望有一种将

5、个体用户感兴趣的信息有针对性的主动推荐出来,对不同用户提供不同的服务策略和服务内容的服务模式,即个性化信息服务方式。为了满足用户的个性化需求,许多研究者提出了各种解决方法。信息检索(IR)是最早基于内容的推荐技术,在用户给定的检索命令和条件下查找符合条件的内容。信息过滤(IF)技术使用用户模型来描述用户兴趣,将新的网页与用户模型进行相似度计算,将相似度高的网页推荐给用户。文献[1~3]基于协作过滤的方法提供个性化服务,但需要用户输入额外信息以判断用户的个性化行为。基于类别的个性化服务取决于类别的设定和网页内容的分类。分类的粗糙导致了信

6、息的查全率(Recall)和查准率(Precision)不高,从而很难向用户推荐准确和用户感兴趣的网页。本文提出把信息检索、信息过滤与数据挖掘技术相结合,构造一种有效的模型来实现个性化服务中网页的推荐,满足用户个体信息的需求。1推荐模型结构在图1中,我们提出了基于挖掘用户历史浏览行为(记录在服务器日志中),结合信息检索、信息过滤技术的推荐模型结构,用户兴趣和文档由概率分布模型来表示。当得到个体用户兴趣后,通过聚类建立群体用户兴趣,而个体用户兴趣可以从群体用户兴趣中进行学习和扩展。在用户浏览过程中,我们将对用户访问的行为和浏览的网页进行

7、记录、分析和特征抽取,并且将用户的反馈传递到个体用户兴趣库中,从而进一步补充和完善个体用户兴趣库。同时通过群体聚类反馈到群体用户兴趣库中,再更新群体用户兴趣库。图1个性化信息推荐模型结构2关键技术2.1Web记录数据预处理数据预处理阶段的目标是要将服务器的访问记录LOG文件、站点文件和其他统计信息等信息整理成事物数据库,以供数据挖掘阶段使用,这一阶段的工作对挖掘结果有重要的影响。数据预处理的主要内容有:数据清洗、用户识别、确定用户会话、完善访问路径、用户事物模式识别等[4],数据预处理过程如下图所示。图2数据预处理流程2.2用户兴趣建

8、模用户兴趣建模的方式:①通过用户浏览的网页,对搜索结果的反馈信息建立和更新用户兴趣;②在用户没有明确参与的情况下,通过观察用户的浏览行为建立和更新用户兴趣[5]。本文采取这两种方式相结合来表示用户兴趣和文档。目前,传统的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。