欢迎来到天天文库
浏览记录
ID:52963647
大小:319.40 KB
页数:6页
时间:2020-04-04
《基于关联规则的SNS网站个性化推荐研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第4l卷第23期数学的实践与认识Vo1.41.NO.232011年12月MATHEMATICSINPRACTICEANDTHEORYDec..2011基于关联规则的SNS网站个性化推荐研究武森,徐丽,李志才(北京科技大学经济管理学院,北京100083)摘要:以关联规则为理论基础,针对社会性网络服务(SocialNetworkingServices,SNS)网站的个性化推荐问题进行研究.在系统总结个性化推荐方法基础上,详细给出基于关联规则的个性化推荐过程,综合运用可信度和作用度两个指标更好地对生成的关联规则进行评价.并采用SNS网站实际运营数据有效实现个性化推荐,对个性化推荐技术在SNS网站的
2、实际应用价值进行拓展分析.关键词:社会性网络服务;个性化推荐;关联规则1引言在20世纪90年代,个性化推荐被作为一个独立的概念提出来其通过建立用户与产品之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而向用户提供个性化推荐服务.个性化推荐从根本上说是代替用户评估未接触过的产品.这些产品包括图书、电影、CD、网页、甚至可以是饭店、音乐、绘画等等..个性化推荐技术可以分为如下几类[2-3]:一是协同过滤(collaborativefiltering)[-5].其核心思想是利用用户的历史信息计算用户之间的相似性,然后利用与目标用户相似性较高的邻居对其他产品的评价来预测
3、目标用户对特定产品的喜好程度,进而根据这一喜好程度来对目标用户进行推荐.二是内容过滤(content—basedfiltering)该方法分别对用户和产品建立配置文件,通过比较用户与产品配置文件的相似度,向用户推荐与其配置文件最相似的产品.三是混合推荐(hybridrecommendation)[7].所采用的技术是上述协同过滤和内容过滤两种推荐技术的组合.四是最近兴起的基于网络结构(network—based)的推荐算法[8J.基于网络结构的推荐算法不考虑用户和产品的内容特征,而仅仅把它们看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系之中.个性化推荐技术已经在Amazon、e
4、Bay、淘宝、当当等电子商务网站得到广泛应用.一些学者对该项技术在数字图书馆[9】、传统商业[10】等领域的应用也进行了研究.本文对个性化推荐技术在社会性网络服务(SocialNetworkingServices,SNS)网站中的应用进行研充SNS网站作为交互性信息平台能够帮助用户维系并扩展网络世界里有价值的关系网络,其随着Web2.0技术的成熟而出现并得到了快速的发展.本文基于数据挖掘中的关联规则对SNS网站的个性化推荐问题进行研究,并采用某SNS网站的实际数据进行个性化推荐应用分析.收稿日期:2011—07—16资助项目:国家自然科学基金(7077100'7);中央高校基本科研业务费专项
5、资金(FRF—TP一10—006B)数学的实践与认识41卷2基于关联规则的个性化推荐方法关联规则挖掘是数据挖掘领域的一个重要分支,其任务是找出所有满足支持度和可信度要求的关联规则.根据当前用户过去感兴趣的内容,通过关联规则可以推出用户还没有购买但可能感兴趣的内容.本文针对基于关联规则的个性化推荐方法,将可信度和作用度作为评价用户感兴趣的度量标准,生成了最终的推荐结果.2.1关联规则基础关联规则由Agrawa等人于1993年提出,它是指大量数据项集之间有趣的关联或者相关联系[11].设={l,i2,⋯,)是项的集合,D是事务数据库,每个事务是不同项的集合,.设A和B都是项集,关联规则是形如A:
6、>B的蕴含式,其中AcI,BcI,并且nB=.关联规则A=>B在事务集D中的支持度support和可信度confidence分别为support(A=>B)=P(AnB)和confidence(A=>B)=P(BIA).关联规则A=>B在事务集D中如果同时满足最小支持度阀值(min—sup)和最小可信度阀值(rain—con/),就可作为强关联规则进行知识输出.关联规则的挖掘算法可以分解为两个子问题:1)求出D中满足最小支持度rain—sup的所有频繁项集,简称频繁集;2)基于频繁集求出满足最小可信度min—co的所有强关联规则.2.2基于可信度的个性化推荐基于可信度的个性化推荐将可信度作为
7、评价用户感兴趣程度的指标.该方法通过扫描数据库中所有用户已经安装应用程序项目集(一个用户形成一条记录,包括用户ID和相应的所有应用程序ID),筛选出这个项目集中出现的所有应用程序,计算相应的支持度,并与最小支持度min—sup相比较,生成满足最小支持度的所有频繁集.然后从频繁集中分别获取目标用户已安装的应用程序集合(已知项目集)和未安装的应用程序集合(推荐项目集).接下来,将已知项目集中的应用程序作为关联规则
此文档下载收益归作者所有