基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品

基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品

ID:19095421

大小:427.50 KB

页数:7页

时间:2018-09-26

基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品_第1页
基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品_第2页
基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品_第3页
基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品_第4页
基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品_第5页
资源描述:

《基于(改进的at模型)主题模型的微博用户兴趣挖掘(用户推荐,广告产品》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、结合微博关注特性的UF_AT模型用户兴趣挖掘研究*王永贵1,张旭1,任俊阳2,刘宪国1(1.辽宁工程技术大学软件学院,辽宁葫芦岛125105;2.吉林省煤业集团有限公司,吉林长春130012)摘要:微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(usersfocus-authortopic)。最后对真实数据进行实验得出,模

2、型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性。关键词:微博;用户关注特性;作者主题模型;兴趣挖掘;中图法分类号:TP181文献标志码:AResearchonmicro-bloguser’sinterestminingbasedonUF_ATmodelwhichcombiningwiththefocusingfeatureofthemicroblogWangYong-gui1,ZHANGXu1,RenJun-yang2,LIUXian-guo

3、1(1.Collegeofsoftware,LiaoningTechnicalUniversity,Liaoning,,Huludao,125105,China;2.JilinCoalIndustryGroupCo.,Ltd.,Jilin,,Changchun,130012,China)AbstractMicroblogasamainstreamsocialnetworkingsites,Theinformationisincreasingbytheexplosivegrowth.Currentlythemethodso

4、fmicrobloguserinterestminingmostremaininthelevelsuchasappearanceoftheresearchofclickingactionwhentheuserbrowsingwebsites,themicroblogcontentuserpostorthecommunitytheybelong,yetin-depthfeaturestomicrobloguserlevel.Fromthecontentofusersposting,combinedwiththefocuse

5、dusers’microblog,proposinganimprovedATmodelUF_AT.Atlasttheexperimentsontherealdatashowthattheprobabilityvaluesofuser’interesttopicsandthewordsonthetopicsofthemodelarehigherthantheATmodel,andtheusers’interesttopicsareaccuracy,entiretyandverifytheeffectiveoftheUF_A

6、Tmodelonmininguser’interest.KeywodsMicroblog;UserFocusFeatures;AuthorTopicModel;InterestMinning7基金项目:国家自然科学基金项目(60903082);辽宁省教育厅项目(L2012113)。作者简介:王永贵(1967-),男(汉),硕士,教授,内蒙古宁城人,主要研究方向云计算、数据挖掘(lntuwyg@126.com) ;张旭+(1989-),女(通信作者),硕士研究生,学士,主要研究方向为数据挖掘;任俊阳(1970-),男,工程

7、师,研究方向为矿山信息化;刘宪国(1981-),男,工学博士,讲师,主要研究方向为计算机图形学与CAD。0引言微博作为web2.0下的社会媒体新形式,以其便捷,快速,易用等特点,备受广大用户喜爱并频繁使用,甚至已深入人们的日常生活。国外的Twitter以及国内的新浪微博均被广泛使用。新浪CEO曹国伟表示:截至2013年3月31日新浪注册用户已达到5.36亿。其用户之多,数据量之大可想而知。如此海量数据不仅吸引了各界学者研究的目光,也使一些商家看见了商机,因此掀起研究微博信息的热潮。文献[1]使用群体兴趣来代表群体中大部分

8、个体兴趣;文献[2]通过将用户的点击对象进行标签,以此作为用户兴趣建模;文献[3]7基金项目:国家自然科学基金项目(60903082);辽宁省教育厅项目(L2012113)。作者简介:王永贵(1967-),男(汉),硕士,教授,内蒙古宁城人,主要研究方向云计算、数据挖掘(lntuwyg@126.com) ;张旭+(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。