欢迎来到天天文库
浏览记录
ID:57924377
大小:223.08 KB
页数:5页
时间:2020-04-14
《基于对偶理论的本体稀疏向量学习算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、云南师范大学学报(自然科学版)JournalofYunnanNormalUniversity2015年7月35卷4期(Vo1.35No.4)DOI:10.7699/j.ynnu.ns一2015—051基于对偶理论的本体稀疏向量学习算法高炜(云南师范大学信息学院,云南昆明650500)摘要:作为一种语义计算和结构化信息存储模型,本体已被广泛应用于生物、物理、地理信息系统等多个领域.在本体学习算法中,本体图顶点所对应的概念信息用一个多维向量来表示.但在大部分应用背景下,顶点之间的相似度取决于少部分分量
2、.基于对偶理论得到本体稀疏向量的计算方法,将该算法应用于数学本体和大学本体,通过P@N准备率来说明算法的效率.关键词:本体;相似度计算;本体映射;稀疏向量中图分类号:TP393.092文献标志码:A文章编号:1007—9793(2015)04—0046—051引言传统的启发式本体计算方法已经无法胜任大数据量的本体相似度计算,因而利用各种学习算法来得到本体相似度计算函数和本体映射已成为近几年研究的重点.本体数据模型可用图G一(、/r,E)来表示,一类本体学习算法其基本思想是得到一个实值本体函数厂:一
3、.该本体函数的作用是将所有本体顶点映射到实数轴,从而顶点对应的概念之间的相似度可以用它们对应的实数在数轴上的距离来衡量.文献[1]提出了正则化框架下的半监督本体算法,在计算模型中充分利用未标记数据的相关信息,同时将数据嵌入到特征空间,利用特征表示得到相关算法;文献E2]从线性欧氏空间及再生核希尔伯特空间出发,得到有噪条件下的新正则化求解模型,同时将注意力集中到假设空间的设置上;文献[3]给出基于优先图本体相似度计算方法;文献[4]得到基于迭代拉普拉斯的半监督本体学习算法;更多本体学习算法可参考文献
4、[5—7].有关本体算法的理论结果,可参考文献[8—9].本文利用对偶技术得到递归计算方法来计算本体稀疏向量,通过本体稀疏向量再得到本体函数,最后由本体函数来计算概念顶点对应实数在数轴上的距离,从而确定概念之间的相似度.2算法描述当使用机器学习方法进行本体相似度计算时,需要将每个顶点的信息用一个维向量来表示.记一{一,口}是顶点对应的向量.为了表示方便,用来同时表示顶点以及对应的向量.本体学习算法最终目标是获得本体实值函数:一,通过顶点对应的实数在数轴上的距离来衡量顶点对应的概念*收稿日期:201
5、5—01—25基金项目:国家自然科学青年基金资助项目(11401519).作者简介:高炜(1981一),男,浙江绍兴人,博士,讲师,主要从事机器学习和图论方面研究通信作者:高炜.第4期高炜:基于对偶理论的本体稀疏向量学习算法·47·之间的相似度.本体函数的本质是一种降维算子厂:p—.本体概念对应顶点的向量即包含了这个概念的所有语义信息,又涵盖了概念在整个本体图中的邻域关联信息.在实际应用中,向量的维度P会非常的大.例如在基因学本体中,所有基因信息可能都包含在一个向量中.此外,本体图复杂的图结构也增
6、加了计算的复杂度,例如GIS本体.但在实际应用过程中,真正对概念之间相似度起决定作用的恰恰是P维向量中的少部分分量.例如在遗传本体应用中,导致某种遗传病发生的往往是少数基因,大部分基因与该遗传病无任何关系;在交通本体的实际应用中,假设某个地点产生交通事故并造成驾驶员或者路人受伤,那么需要寻找的是和事故发生地点最近的医院,其周边的办公楼和住宅与此无关,即我们的需求是寻找本体图中满足特定邻域结构特征的顶点(概念).由此,稀疏学习算法恰好适合这种本体应用.具体地说,通过本体稀疏向量的学习,本体函数可作如
7、下表示:上()一vifll+(1)£=1这里一(”,)是稀疏向量,其特点是大部分分量的值等于O;是与噪声有关的误差项.在忽略的前提下,由(1)可知,只要得到稀疏向量就可以确定本体函数厂.因此,本体函数学习就归结为本体稀疏向量的学习.设V∈P为本体信息矩阵,它的每一列对应一个顶点的向量,为样本容量.本体稀疏向量p的学习模型可以写成如下矩阵形式:argminz(v/J)+Q(p)(2)口∈吨p其中z()为亏损项,用来衡量本体稀疏向量的精确度;Q()为平衡项,用来衡量本体稀疏向量卢的稀疏程度;>0称为平
8、衡系数.一般情况下,z()可取标准欧氏泛数平方的形式:2()一llvo—Y,其中Y表示期望值构成的向量.根据Fenchel对偶理论m],(2)的对偶间隙为Z()+Q()+Z(一K)其中对偶变量K∈,Q(VK)≤,l(K)一sup~zK—z(z)]为亏损函数l的Fenehel共轭.设pZ—max{Q(Vz()),1).这里,取对偶变量K=一lD1Vl().设prox为中定义的邻接算子.本文将文献[12]中用于图像处理的FISTA方法加以改进,并用于本体模型(2)的求解:输入:初始本体
此文档下载收益归作者所有