欢迎来到天天文库
浏览记录
ID:37062167
大小:2.83 MB
页数:74页
时间:2019-05-16
《基于DWH模型对多模态数据的多视图度量学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于DWH模型对多模态数据的多视图度量学习方法研究作者姓名杨克工程领域计算机科学与技术校内指导教师陆璐教授所在学院计算机科学与工程学院论文提交日期2018年5月TheResearchofMulti-viewMetricLearningforMulti-modalDataBasedonDWHModelADissertationSubmittedfortheDegreeofMasterCandidate:YangKeSupervisor:Prof.LuLuSouthChinaUniversityofTechnologyGuangzh
2、ou,China分类号:TP3学校代号:10561学号:201520131025华南理工大学硕士学位论文基于DWH模型对多模态数据的多视图度量学习方法研究作者姓名:杨克指导教师姓名、职称:陆璐教授申请学位级别:工学硕士学科专业名称:计算机科学与技术研究方向:软件测试与可靠性保障论文提交日期:2018年4月20日论文答辩日期:2018年5月31日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:张星明教授委员:刘发贵教授俞鹤伟教授胡金龙副教授韦佳副教授摘要近年来,随着社会和科技的发展,多模态数据正在爆炸式迅速增长,例如社交媒
3、体数据,通常在机器学习领域的研究任务中,有时候需要多视图学习,即从原始数据集派生成多个视图进行统计分析,有时候需要进行度量学习,因为学习一个好的距离度量函数在信息检索,聚类,分类中是极其关键的,但是现有的研究成果很少有将这两个领域结合起来的,即多视图度量学习。考虑到多模态数据的特殊结构,如果从单一视图考虑,可能没有办法充分挖掘数据的价值,而且在度量学习过程中,使用传统的欧式距离或者马氏距离是不合适的,因为属性变量之间可能会存在相应的相关系数约束,这样看来多视图度量学习是一个很好的解决方案。本文基于双翼簧风琴(DualWingHarmoniu
4、m,DWH)模型对多模态数据进行多视图度量学习方法研究,将多视图学习和度量学习结合起来,主要工作包含以下两个方面:1)提出了一种基于DWH模型的多视图度量学习算法MVDML,该算法通过从多模态数据中提取不同的信息,试图将多个视图嵌入在一个单一的低维隐变量空间,通过最小化相似数据对之间的距离并且最大化非相似数据对之间的距离,在接下来的监督学习的过程中学习最合适的距离度量,针对数据模态超过两个的情形,本文将DWH模型扩展为三翼簧风琴(TripleWingHarmonium,TWH)模型,并且对成对约束条件的生成进行了优化,使用Dask和Numb
5、a进行数据预处理来实现并行加速的目的,实验结果表明该算法是有效并且可扩展的,通过对代码级别的并行加速可以大幅减少算法的运行时间。2)通过特征工程,提取多模态数据中的关键信息,将原始数据转化为特征向量作为算法模型的输入,希望提高模型的准确率,得到更好的结果。本文主要针对IMDb数据集从用户数据、电影数据、评论数据三个模态提取信息,为了得到模型参数,本文在算法里通过在低维隐变量空间模型里使用联合概率密度和损失函数,在解释数据和提供一个有效的距离度量之间找到平衡同时避免过拟合,并和主流的模型和算法进行对比,实验结果表明该算法模型在分类和检索效率上
6、是最优的,计算时间上是有效的。关键词:DWH模型;多视图学习;度量学习;多模态数据IAbstractNowadays,withthedevelopmentofsocietyandtechnology,multi-modaldataisexplodingrapidly,suchassocialmediadata.Intheresearchfieldofmachinelearningtasks,sometimes,weneedmulti-viewlearningtogeneratemultipleviewsfromtheoriginaldata
7、setsforstatisticalanalysis,andsometimesweneedtodometriclearning,becauselearningagooddistancemetricfunctionisextremelycriticalininformationretrieval,clusteringandclassification.However,theexistingstate-of-the-artworksseldominvolvemulti-viewmetriclearning,whichisacombination
8、ofthetwo.Giventhespecialstructureofmulti-modaldata,wemaynotbeabletofullyminethevalueofthe
此文档下载收益归作者所有