基于主题模型的用户画像提取算法研究

基于主题模型的用户画像提取算法研究

ID:35059741

大小:3.37 MB

页数:68页

时间:2019-03-17

基于主题模型的用户画像提取算法研究_第1页
基于主题模型的用户画像提取算法研究_第2页
基于主题模型的用户画像提取算法研究_第3页
基于主题模型的用户画像提取算法研究_第4页
基于主题模型的用户画像提取算法研究_第5页
资源描述:

《基于主题模型的用户画像提取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP391密级:公开UDC:39学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于主题模型的用户画像提取算法研究论文作者:王丹学科:信息与通信工程指导教师:毋立芳论文提交日期:2016年6月UDC:39学校代码:10005中文图书分类号:TP391学号:S201302091密级:公开北京工业大学工学硕士学位论文题目:基于主题模型的用户画像提取算法研究英文题目:RESEARCHONUSERPROFILINGBASEDONTOPICMODEING论文作者:王丹学科专业:信息与通信工程研究方向:数据挖掘与推荐系统申请学位:工学硕士指导教师

2、:毋立芳教授所在单位:电子信息与控制工程学院答辩日期:2016年6月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:王丹日期:2016年6月6日关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以

3、公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:王丹日期:2016年6月6日导师签名:毋立芳日期:2016年6月6日摘要摘要社交网络以及以社交为基础的互联网应用的迅猛发展带来数据的爆炸式增长,提出了个性化推荐的应用需求。用户画像提取是个性化推荐的关键。近年来社交网络的发展趋势是媒体类型不断丰富,用户参与门槛的不断降低。用户表达的数据模态多样,为用户画像提取提供了更广阔的空间。本论文针对新型社交网络——社交策展网络数据,开展用户画像提取研究,具体工作如下:1.提出了一种结合主题模型和点互信息的用户画像提取(TM-PMI)方法。

4、从LDA模型的思想、原理以及LDA求解方法—吉布斯采样等全面描述了用户文本信息建模的方法。将用户文本信息主题模型和点互信息结合建立用户个性化主题词,得到个性化用户画像。通过对用户推荐收藏条目进行实验验证。设计了一种UserStudy的方法。实验结果表明,相比于传统LDA模型,TM-PMI表达能力更好,推荐结果也得到提升。2.提出了一种社交策展网络多层LDA模型(MLLLDA)的用户潜在兴趣画像提取的方法。分析社交策展网络“转发链”的特点,针对社交策展网络用户两种模态数据——收藏条目的描述文本信息和转发链的用户ID集合,结合用户收藏条目描述文本信息的潜在主题分布以及转发链上用户ID的兴

5、趣分布计算用户潜在兴趣分布,用于社区发现。并计算目标用户和每个用户IDJensen-Shannon散度值,进行用户推荐。实验结果表明MLLDA可以有效发现用户社区,并得到有效的用户推荐。关键词:用户画像;主题模型;LatentDirichletAllocation;社交策展网络;推荐系统IAbstractAbstractThedevelopmentofsocialnetworkbringsabouttheexplosionincreasmentofsocialdata.Itproposedtheneededrecommendationsystem.Userprofilingisone

6、ofkeyissuesinrecommendationsystem.Inrecentyears,thetrendofsocialnetworkdevelopmentisthediversityofdatamodalitiesanddecreaseofrequirementofuserinteraction.Themultimodeprovidedmoreextendedpossibilitytouserprofiling.Inthisthesiswefocusonthenewsocialnetwork–contentcurationsocialnetwork,tostudyprobl

7、emofuserprofiling,thedetailsareasfollows:1.Weproposedauserprofilingmethodbycombiningtopicmodelingandpointwisemutualinformation(TM-PMI).TheideaofLDAmodel,theprincipleandthemethodofLDAinferencealgorithm--Gibbssamplingisacomprehensiv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。