贝叶斯网络在用户兴趣模型构建中的研究_王庆福.pdf

贝叶斯网络在用户兴趣模型构建中的研究_王庆福.pdf

ID:48056322

大小:886.71 KB

页数:2页

时间:2019-10-08

贝叶斯网络在用户兴趣模型构建中的研究_王庆福.pdf_第1页
贝叶斯网络在用户兴趣模型构建中的研究_王庆福.pdf_第2页
资源描述:

《贝叶斯网络在用户兴趣模型构建中的研究_王庆福.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第12期无线互联科技No.122016年6月WirelessInternetTechnologyJune,2016贝叶斯网络在用户兴趣模型构建中的研究王庆福(辽宁行政学院,辽宁沈阳110161)摘要:用户兴趣模型对于用户画像的刻画至关重要。用户画像是用户在互联网中的身份证,完整地构建用户画像能够相对明确地知晓用户需求,这对于互联网时代提升用户体验非常重要。众所周知,电商购物、新闻视频推荐等众多领域都需要清晰地刻画用户画像,根据用户的兴趣定向推荐相关内容。关键词:用户画像;兴趣模型;内容推荐互联网时代对内

2、容信息的精细化已经越来越明确,传统根据两个变量的规则变化,推广到多边量上,可得公式3:的信息粗分类的组合方式已经逐渐淡出人们的视野。信息粗(3)分类方式目前以门户网站(新浪、搜狐)和一些信息分类网1.2贝叶斯推断站(58、赶集网)为主要形态。在信息粗分类的基础上衍生贝叶斯推断是在贝叶斯定理的基础上进行变形,P(A)了大量的垂直内容型平台,今日头条以咨询内容推荐为依托就是先验概率,是事件B发生之前A事件的概率。P(A

3、B)是已经在国内拥有非常大的用户群,今日头条是区别于传统的后验概率,是事件B发生以后发生

4、事件A的概率。门户新闻类网站,传统的门户新闻类网站需要承载太多的内1.3朴素贝叶斯法容,而且以热门推荐为主要方式,今日头条则以个性户的推朴素贝叶斯方法是在贝叶斯定理和贝叶斯推断的基础上荐方式为主,根据用户的兴趣特点构建内容聚合流。不仅在进行条件独立性假设,通常用来进行分类。为什么要进行独新闻推荐这一领域,其它领域也不断衍生出大量的垂直细分立性假设呢,其实就是为了简化计算。因为涉及两个条件以频道。淘宝作为国内最早从事互联网电商的平台,淘宝的分上的条件概率时计算公式。在构造朴素贝叶斯结构图时如果类非常广,从

5、服装、虚拟充值到票务,大量的分类信息在淘事件是条件独立的P(A

6、B,C)=P(A),可以进行简化。宝上都能够找到对应的分类,随后出现以京东为主的电子类1.4贝叶斯网络产品购物平台以及后来主打女性购物平台的蘑菇街和美丽朴素贝叶斯方法要求各个事件条件独立,这个要求在实说。可见,随着社会分工越来越精细化,在互联网时代中也际场景中很难真实存在,于是就有了贝叶斯网络,贝叶斯网同样需要各个领域作精细化分类。络不像朴素贝叶斯要求那么高,各个事件之间不必是条件独用户画像作为用户在互联网中的身份证就说明了用户的立的。贝叶

7、斯网络主要包含了条件概率表和网络结构图。通一切。从传统行业到互联网行业,无不希望能够精准地构建常贝叶斯网络的难点在于如何构建贝叶斯网络,因此对于贝用户画像,这意味着清晰地掌握了用户需求,就能够精确地叶斯网络的研究也包含了结构学习和参数学习两个方面。贝为用户提供所需要的服务。用户画像中一个重要的组成部分叶斯网络结构如图1所示。是用户兴趣,用户兴趣处于实时变化中,用户的一些静态信息基本上处于不变或者长期稳定的状态,用户的性别和年龄信息、用户的居住地信息以及用户的学历信息等都非常稳定,因此用户画像的关键是构建

8、用户的兴趣模型。贝叶斯网络作为用户兴趣模型构建重要模型,本文主要针对贝叶斯网络在用户兴趣构建的应用展开研究。1贝叶斯网络图1贝叶斯网络结构贝叶斯网络作为机器学习中重要算法,通过将事件中各2用户兴趣模型构建个状态构建为网络中各个节点,各个状态之间的转换概率则简而言之,用户画像是根据用户社会属性、生活习惯和转变为节点之间的边连接权值,对贝叶斯网络中各个节点之消费行为等信息而抽象出的一个标签化的用户模型。构建用间的边连接权值进行训练学习,这便构成了贝叶斯网络。户画像的核心工作即是给用户贴“标签”,而标签是通过

9、对1.1贝叶斯定理用户信息分析而来的高度精炼的特征标识。除去“标签化”,贝叶斯定理就是概率论中的条件概率,如公式1所示:用户画像还具有的特点是“低交叉率”,当两组画像除了权(1)重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。对公式1进行变化可得公式2。用户的兴趣一般都是基于一定的环境,所以既要考虑(2)到不同的划分角度,又要考虑到不同时间段内用户兴趣的转作者简介:王庆福(1979—),男,辽宁沈阳,本科,讲师;研究方向:计算机网络与数据库技术。-101-第12期No.1220

10、16年6月无线互联科技·实验研究June,2016移。如现有的用户短期兴趣模型和长期兴趣模型,以及混合兴趣模型,将用户的兴趣划分成相应的等级,根据权值进行度量。兴趣的转移可以通过对比不同时间窗口内用户浏览内容的关键字聚类的结果得出。数据是构建用户兴趣标签的核心。用户兴趣标签主要依赖3类数据。第一,用户数据。静态用户数据:用户相对稳定的信息,主要包括用户的自然属性,商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。