关系网络数据的半监督分类方法研究

关系网络数据的半监督分类方法研究

ID:33726401

大小:2.44 MB

页数:61页

时间:2019-02-28

关系网络数据的半监督分类方法研究_第1页
关系网络数据的半监督分类方法研究_第2页
关系网络数据的半监督分类方法研究_第3页
关系网络数据的半监督分类方法研究_第4页
关系网络数据的半监督分类方法研究_第5页
资源描述:

《关系网络数据的半监督分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文↑(宋体小1号字加粗)关系网络数据的半监督分类方法研究↑(黑体2号字)RESEARCHONSEMI-SUPERVISEDCLASSIFICATIONMETHODSFORRELATIONALNETWORKDATA↑(TimesNewRoman2号字加粗,题目太长时可用小2号字)石瑞超↑(宋体小2号字加粗)哈尔滨工业大学2013年12月万方数据国内图书分类号:TP399学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文关系网络数据的半监督分类方法研究硕士研究生:石瑞超导师:叶允明教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研

2、究生院答辩日期:2013年12月授予学位单位:哈尔滨工业大学万方数据ClassifiedIndex:TP399U.D.C:621.3DissertationfortheMasterDegreeinEngineeringRESEARCHONSEMI-SUPERVISEDCLASSIFICATIONMETHODSFORRELATIONALNETWORKDATACandidate:RuichaoShiSupervisor:Prof.YunmingYeAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:Computer

3、Science&TechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:December,2013Degree-Conferring-Institution:HarbinInstituteofTechnology万方数据摘要摘要随着互联网的发展,特别是移动互联网和社会化媒体的普及,实际应用中需要处理的数据样本,不再是单独存在的个体,而是与其它数据样本相互依赖。这种存在相互依赖关系的数据样本集合,被称为关系网络数据。如在微博应用中,用户与用户相互关注,构成了一个以微博用户为节点,关注关系为边的关系网络数据。对关

4、系网络数据中的样本进行分类时,有效利用样本间的依赖关系能提高分类精度。如相互关注的微博用户倾向于有相似的兴趣爱好,存在超链接关系的网页倾向于有相似的主题。关系网络数据的分类问题也被称为协同分类问题。近十年来,国内外研究人员对协同分类问题进行大量的研究并提出很多能利用关系提高分类精度的算法。然而在实际应用中,要构建大量的训练样本,成本非常高,会耗费大量的人力和物力。于是在训练样本稀少的情况下,如何利用大量测试样本进行半监督协同分类成为近几年的研究热点。本文研究了关系网络数据的半监督分类问题并提出一些解决方法。主要工作包括:(1)将关系网络数据的半监督分类问题分解成三个核

5、心子问题:基于内容属性的半监督分类问题、关系的类标传递能力的学习问题和内容属性与关系信息的结合问题。(2)提出一个强同质关系网络生成方法,在训练样本稀少情况下,将弱同质关系网络转换成强同质关系网络,解决弱同质关系网络数据中关系的类标传递能力的学习问题。(3)提出一个网络正则化生成模型,解决强同质关系网络数据的半监督协同分类问题。网络正则化生成模型构建了一个基于概率隐含语义分析(PLSA)的生成模型,并引入网络正则化因子,将半监督协同分类问题转化成全局最优化问题。同时本文使用了期望最大化算法,通过最大化网络正则化生成模型的目标函数,训练模型参数并预测测试样本的类标。在三

6、个基准数据集上的实验结果表明,本文提出的网络正则化生成模型显著优于其它前沿协同分类算法。关键词:关系网络数据;半监督协同分类;生成模型;网络正则化-I-万方数据AbstractAbstractWiththedevelopmentofInternet,especiallywhileonlinesocialmediaandmobilenetworkarebecomingmoreandmorecommoninrealworld,thereexistsalargenumberofrelationalnetworkdatawhereinstancesarenolongerind

7、ependenttoeachotherandtheyarelinkedtogether.Forinstance,amicroblogsystemcanbeviewedasarelationalnetworkdatawherenodesrepresentusersandrelationsrepresentfriendships.ClassificationtaskfornetworkdataisknownasCollectiveClassification(CC)problemandithasdrawnmuchattentioninpasttenyea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。