欢迎来到天天文库
浏览记录
ID:35066702
大小:6.08 MB
页数:66页
时间:2019-03-17
《基于概率图模型的社交网络信息过滤方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、夺因种遷若若大赛UniversityofScie打ceandTechnoloofChinagy硕±学位论文)..I儀论文题目基于柄率图換型的社交网緣信息过滤方法研堯作者姓名那全您控制科学与工程学科专业导师姓朵良固研堯员名I二0—六年五月完成时间I中逸种《接禾乂#硕±学位论文 ̄ ̄r基于概率图模型的社交网络信息过滤方法研究作者姓名:邢金彪^学科专业:控制科学与工程J[导师姓名:宋良图研巧员完成时间—六年五月:二〇UniversitofScienc
2、eandTechnoloofChinaygyA’dissertationfo「mastersdereegAStudofSocialNetworkyInformationFilteringBasedonProbabilisticGrahicModelpA’u化orsName:JinbiaoXingSecialit:ControlScienceandEngineeringpyuervisor:Prof.LiantuSon.SpggFinishedtime;Ma2016y,中国
3、科学技术大学学位论文原创性声明本人声明所堪交的学位论文,是本人在导师指导下进行研究工作所取得的成巧,。除己特别加标注和致谢的地方外论文中不包含任何他人己经发衷或撰写过的硏究成果一。与我同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:签字日期:兴旅。中国科学技术大学学位论文授权使用声明一作为申请学位的条件之,学位论文著作权拥有者授权中國科学技术大学拥有学位论文的部分使用权,目P;学校有权按有关规定向围家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可レッ将学位论文编入《中国学位论文全文数据库》
4、等有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。□保密(年)、^公开__X作者签名:隻导师签名:k作終j签字日期:赚旅分签字日期;1^八心\摘要摘要随着社交网络平台的快速发展,人们面临着对爆发性増长的社交网络数据无从选择的困境,信息过滤成为帮助人们摆脱困境的有效方法。社交网络信息可分为无用的垃圾广告信息和正常的网络数据信息。垃圾广告信息降低了用户体验,形响了社交网络上的科学研究,所需要被滤除,这
5、种处理称为非个性化的信息过滤。而个性化的信息过滤是指从正常的网络信息中选取对用户有益的信息进行推荐。如此不仅提升了社交网络平台的用户体验还促进其自身商业价值的提高,并且能。个性化信息过滤需要构建准确的用户兴趣模型有效的分析预测用户的兴趣变化方向。这些均レッ社交网络数据为研巧基础,然而社交网络数据具有复杂性高、多元性、不确定性等特点,传统的机器学习方法很难很好的处理这种数据。概率图模型有效的结合了概率论和图论的化势,能够有效的处理这种不确定性问题-。因此本文通过利用概率图模型方法中两种典型的方法隐含狄利克雷分配(LDA)和概率矩阵分解(P
6、MF)来解决社交网络中的垃圾信息过滤和用户兴趣预测问题,并W此来说明概率图模型在处理化交网络大量复杂数据的优势W及应用前景。本文主要研巧内容概括如下:一一LDA分类特征扩展的微博广告过滤方法第。当前的,提出种新的基于微博垃圾广告检测过滤方法主要是基于短文本分类的方法,但其很少考虑微博文本语义。、短文本特征稀疏、背景领域特征及非平衡数据集分类的问题本文方法从解决这些问题入手,引入LDA主题模型对短文本按照其所属类别分类进行特征扩展来缓解文本特征稀疏问题;通过识别背景领域特征并降低其权重来减弱对分类性能的影响最后对于非平衡数据集的广告过滤问
7、题,使用欠采样;(undersampling)方法解决。实验结果显不,本文方法可W更准确的识别并过滤微巧中的垃圾广告信息。第二,构建了基于社交圈的用户兴趣预测方法。针对现存的用户兴趣分析方法仅根据用户历史行为信息、相似用户等对用户兴趣进行分析,很少有研巧工作主动预测用户的兴趣变化的研究现状。本文通过细致的分析发现,影响用、、户兴趣变化的因素主要有:用户历史行为信息用户社交关系兴趣主题间关联关系W及用户兴趣随时间的衰减。综合W上各影响因素,基于PMF方法设计实现了基于社交圈的兴趣预测方法。综合各实验评价指标表明,本文方
此文档下载收益归作者所有