欢迎来到天天文库
浏览记录
ID:34530590
大小:1.55 MB
页数:4页
时间:2019-03-07
《毕业设计中英文翻译new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、专题第 8 卷第 6 期2012 年 6 月推荐引擎:信息暗海的领航员112TerryLau张韶峰周涛1北京百分点信息科技有限公司关键词:推荐引擎电子商务海量数据2电子科技大学引言景和产品,呈现较完整的个性化推荐的轮廓。互联网的发展使我们获取的信息总量以指数级系统架构别增长,目前已知的网页超过5000亿,仅淘宝网上就有接近10亿件商品。而我们分辨甄选信息的能力作为商用的推荐引擎,良好的架构设计是服务并没有提高。对于普通用户来说,大多数信息是暗稳定、可靠和扩展的基础。信息——我们有可能对某些信息感兴趣,但由于没如图1所示,百分点推荐引擎分为存储层、业有“领航员”的帮助,我们无法看到这些信息。这
2、务层、算法层和管理层四大功能组件。每个组件内种被称为“信息过载”的问题,正是目前互联网发部又分为更小的单元或者服务模块,提供基本的存展中遇到的最棘手、最重要的问题。储或运算服务。单元与单元之间尽量解耦和,仅通推荐引擎最有希望解决信息过载的问题。推过API协议进行协作,这样一个单元的升级变动带荐引擎的本质是通过分析用户历史活动的记录,来的影响是可控的。包括音乐下载、视频观看、图书购买、网络约存储层 提供基本的数据存取服务,并做好会、朋友互动、论坛评论等等,分析用户的个性备份和容灾恢复工作,以保证数据的安全可靠。根化喜好,主动向用户推荐他们感兴趣的信息。推据不同的应用需求,存储层分为Redis集
3、群、Mem-荐引擎的精髓是个性化,通过分析群体数据,得base集群、MySQL集群和Hadoop/HDFS四类。其到每位用户的个性化喜好,再进行个性化推荐。中Redis和Membase作为缓存,提供高效的读写操很多用户最早接触的推荐引擎是亚马逊(Ama-作,支持实时计算,MySQL集群用于固化缓存中zon)的推荐服务,因此留下了一些刻板的印象,的数据,Hadoop/HDFS为海量数据的存储和分析提例如推荐引擎服务的都是电子商务公司,采用的供支持。都是相似的挖掘方法(比如关联规则和协同过算法层 是推荐引擎最核心和最具挑战性的滤),“看过还看过,买过还买过”这类推荐通部分,在百分点推荐引擎中是一
4、系列推荐算法的集过简单的数据库查询就可以完成。合,包括简单的基于相关的联规则挖掘、用户协同我们正在经历由个性化推荐技术构筑未来商业过滤、产品协同过滤、局部扩散与热传导算法,复模式,基于很多读者对个性化推荐的憧憬和误解,杂的考虑标签、内容和属性的统计学习模型,剖分本文将以国内领先的推荐引擎提供商为实例,介绍用户长短期兴趣的实时自适应算法等等。算法层不其架构和算法,展示基于个性化推荐技术的应用场关心具体的业务逻辑,只负责数据处理和结果返22第 8 卷第6 期2012 年 6 月案例基于用户行为的推荐算法配置基于内容的推荐算法管理推荐引擎的应用不仅局算法层业务层推荐引擎:信息暗海的领航员基于资源扩
5、散的推荐算法限于商品的推荐。目前,以个HTTPWeb基于热传导的推荐算法Service性化推荐为主营业务的公司,聚类算法服务除了百分点科技公司以外,监控关联规则算法还有Baynote、ChoiceStream和……Goodrec等等。很多公司自行开存储层自动应发推荐引擎。从表1中可以看急处理到,信息推荐应用非常广泛。Redia集群Membase集群MySQL集群Hadoop/HDFS图2是推荐引擎最常见的管理层表现形式——“看过还看过”与“买过还买过”推荐栏,类图1百分点推荐引擎架构图似的有“看过的最终购买”,“买过还看过”等等。图2中回。这使得推荐算法具有了最大的通用性,也保证的信息来自于
6、百分点合作伙伴“新七天电器网”的了前端的推荐功能模块可以根据逻辑需求综合多个真实推荐,这两个用户最终都购买了推荐栏中的产算法。品。“看过还看过”推荐栏的产品品类比较集中,业务层 是推荐引擎中直接面向客户的部表1推荐引擎服务公司及其推荐产品示例分,主要职责是收集客户提交的数据,将其转换(更多的例子可以参考苏萌等人的著作为推荐算法需要的输入,交由推荐算法计算;根《个性化:商业的未来》)据客户提交的推荐请求,请求一个或几个推荐算推荐引擎服务公司推荐信息类型法数据,转换为客户接收的数据格式。业务层是Amazon书/其他商品连接具体需求与推荐算法,真实世界与计算机世Douban书/电影Facebook
7、朋友界的桥梁。WeFellow朋友管理层 负责整个系统的服务管理、服务监SinaWeibo关注对象控和应急处理,是推荐引擎的控制中枢,直接决定Nanocrowd电影了推荐服务的质量和体量。百分点推荐引擎响应请Jinni电影求的平均时间在200毫秒左右,每天处理5000万次Digg新闻Zite新闻左右的推荐请求,每天通过推荐引擎产生价值400NetflixCD/DVD万元的订单,这个数字还在快速上升。推荐引擎的C
此文档下载收益归作者所有