欢迎来到天天文库
浏览记录
ID:20131423
大小:79.57 KB
页数:4页
时间:2018-10-08
《基于交互行为的用户兴趣挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于交互行为的微博用户兴趣挖掘课题背景随着web2.0时代的到來,互联网已成为全球必不讨少的信息资源库,信息爆炸式增长,用户不仅接收着信息,同吋也制造着信息,作为web2.0时代网络信息分享平台的典型代表,微博应运而生,得到了迅速的发展和广泛的应用。微博(Weibo)[,],即微型博客(MicroBlog)的简称,也即是博客的一种,是一种通过关注机制分享简短实时信息的广播式的社交网络平台。用户可以通过web.wep等各种客户端组建个人社区,以140字(包括标点符号)的文字更新信息,并实现即时分享与社交。根据中国互联网信息中心(CNNIC)发布的2015年第36次《中国互联网络发
2、展状况统计报告》(C顺TC,2015)[2],截至2015年6只,我国网民规模达6.68亿,互联网普及率为48.8%,互联网用户数量的激增,进一步刺激了以互联网为载体的各种信息服务和应用的发展,半年内新増网民1894万人。社交网络如Facebook,Twitter,微信,新浪微博等已成为当今世界最为流行的信息分享平台。随着社交网络的快速发展,用户规模的不断扩大,信息更新的不断加快,社交网络中的用户找到自己感兴趣的信息变得越发困难。如何在海量信息中寻找有价值的信息,挖掘用户的兴趣点,帮助用户获得他们所需的高质量的信息A容,降低用户获得冇效信息的成本,准确的发现用户兴趣,构建用户的
3、兴趣模型,进而有针对的进行个性化推荐服务成为FI前学术界和工业界关注的研究热点。对于利用微博进行营销和投放广告的企业和机构來说,发现用户兴趣是实现个性化服务的前提,同时川*以找到潜在兴趣点的用户,提高广告投放的精准度,进而増加利润。因此,对于想要微营销的企业來说,发现用户兴趣也是十分必要的。作为个性化服务和网络营销的基础和核心技术,用户兴趣挖掘方法的研究已逐渐分离出来成为了独立的研究课题,与此同时推荐技术也得到广泛关注。研究思路本课题通过展开多源融合的情境感知用户兴趣挖掘理认与方法的研究,研究情境特征,构建知识库,结合微博内容与微博交互信息进行用户兴趣模型的挖掘,挖掘用户的兴趣
4、主题,进而满足社交网络用户的个性化信息需求,实现高质量的社交网络个性化推荐。基于微博内容的用户兴趣挖掘可以获得较为精准的挖掘结果,但会而临冷启动和数据稀疏问题。基于交互关系的用户兴趣挖掘方法和基于交互信息的用户兴趣挖掘方法可以从两个不同的角度弥补基于微博内容的用户兴趣挖掘方法的缺陷。此外,在表征用广个人属性的静态信息中,往往还包含着用户0己显式定义的兴趣标签,可以通过这些建立标签与微博主题的关系来识别用户的兴趣主题。基r•川广交互行为的川广兴趣挖掘fQ.力网II:犮V认夂什的络区aK想的ftp.tfklftfeIHt^wxr语料库建立微博用户知识库中的内容主要包括微博用户情境知
5、识及微博用户兴趣知识两部分。(1)微博用户情境知识。本研究拟从用户个人属性的静态信息、用户交丑关系信息、用户交互信息以及用户微博内容信息四个角度对微博用户的情境信息进行描述。用户个人信息应包拈用户个人基本信息、&定义的个性化特征标签、教育经w以及工作经历等;用户交互关系信息主要包括用户通过关注、评论、转发等构成的社交关系情况;用户交互信息应包括评论、转发的微博编号、吋间、以及用户对微博的评论内容和转发过程屮发表的评论内容等;用户的微博内容信息包括用户发布、收藏的微博的具体(A)容等。(2)微博用户兴趣知识。在微博用户的个人信息中包含着用户Q定义的个性化标签,是用户显式兴趣的主要
6、来源;而用户的关注对象群体、粉丝群体的所表现出的共性特征将是用户隐式兴趣的体现:用户发布、转发、评论、收藏的信思内容所表现岀的共性特征也是用户隐式兴趣的体现。同时,一个用户的兴趣通常由若干个兴趣领域组成,并且可区分稳定兴趣和临时兴趣。因此,在表示微博用户兴趣知识吋,需要综合考虑多方面因素,实现多源数据融合的用户兴趣知识库构建。目前里然已经有学者对丁*微博用户情境进行了相关研究,并对用户交互行为所包含的A容进行了分析,但尚无人提出微博用户情境知识的形式化表示方法。此外,学者们已经提出了很多用户兴趣建模的方法等,但这些方法基本都是针对Web用户兴趣进行描述的,用户模型屮并没有考虑到
7、专门针对微博用户屮交互灯为对用户兴趣的影响。因此,对于概念之间的关系相对较为复杂的、由多源数据融合构成的微博用户知识,需耍建立专门的形式化模型进行描述。本体作为“共享概念模型的明确的形式化规范说明”,可以提供概念间明确的语义关系,在领域知识表示方面具有良好的形式化表达能力,推理能力较强,可实现多数据源的信息共享和重用。木研究拟采用基于木体的方法构建微博用户知识库。微博用户知识本体吋用六元组形式进行描述,如式(1)所示。0={C,AcyRyAH,X}(1)其中:c表示概念的集合,每一个概念表
此文档下载收益归作者所有