基于图的半监督学习的距离度量改进-论文.pdf

基于图的半监督学习的距离度量改进-论文.pdf

ID:53762972

大小:280.37 KB

页数:4页

时间:2020-04-24

基于图的半监督学习的距离度量改进-论文.pdf_第1页
基于图的半监督学习的距离度量改进-论文.pdf_第2页
基于图的半监督学习的距离度量改进-论文.pdf_第3页
基于图的半监督学习的距离度量改进-论文.pdf_第4页
资源描述:

《基于图的半监督学习的距离度量改进-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第4卷第2期智能计算机与应用Vo1.4No.22014年4月INTELLIGENTC0MPUTERANDAPPLICATIONSApr.2014基于图的半监督学习的距离度量改进兰远东,高蕾(惠州学院计算机科学系,广东惠州516007)摘要:基于图的半监督学习的一个关键问题是:图上顶点之间的距离度量的有效性问题。为了解决这个问题,提出了基于图的半监督学习的距离度量改进方法。通过在现有密度敏感的距离度量方案中添加补偿参数的方法,使得改进的距离度量方案不但能够有效地扩大不同类别的高密度区域样本间的距离,同时还能缩小相同类别中样本之间的

2、距离。将改进的距离度量方案应用到聚类算法中,来验证改进的距离度量方案的有效性。实验结果表明:改进的距离度量方法能够有效地扩大不同类别间距离,增强类内聚合度。关键词:半监督学习;距离度量;聚类;机器学习中图分类号:TP319.4文献标识码:A文章编号:2095—2163(2014)02—0032—04ImprovedDistanceMeasureforGraphbasedSemiSupervisedLearningLANYuandong.GAoLei(DepartmentofCompu~rScience,HuizhouUniver

3、sity,HuizhouGuangdong516007,China)Abstract:Akeyproblemingraph—basedsemisupervisedlearningistheeffectivenessofdistancemeasurementbetweentheverticesofgraph.Inviewofthis,animproveddistancemeasuremethodisproposedforsemi-supervisedlearning.Themethodcaneffectivelyamplifyth

4、edistancebetweendatapointsindifferenthighdensityregionandreducesthedistancebe—tweendatapointsinthesamehighdensityregionbyaddinganoffsetparameter.Then,agraphbasedsemisupervisedcluste—ringalgorithmispresentedbasedonthisimproveddistancemeasurement.Experimentalresultssho

5、wsthattheimprovedmethodcaneffectivelyincreasethescatterofinterclassesandreducethescatterofintra—class.Keywords:SemiSupervisedLearning;DistanceMeasurement;Clustering;MachineLearning0引言但是根据聚类假设,点A与点丑则属于同一个类别,也就是半监督学习的目的是利用无标记数据来改进机器学习A与B更加相似,意即更加接近。公式(1)的距离计算方法,的性能。聚类假

6、设认为决策边界应该存在于数据的低密并不能反映图1中的这种情况。度区域,而不是存在于高密度区域。几乎所有有效的半监督学习方法都是基于聚类假设,或者间接使用了聚类假设。基于图的半监督学习方法通过利用所有数据来构建一个图,图上的节点就是数据集中的样本点(包含标记数据和未标记数据),连接图上任意两个顶点之间的边则是两个样本点之图1距离度量示例间相似性的表征。学习方法通常并不需要数据点本身,而Fig.1Examplefordistancemeasurement是需要两个点之间的距离。这样的学习方法都假定样本点为了解决这个问题,文献[12,

7、13]中提出了两个版本的的标记在图上平滑分布,而图则是基于图的半监督学习方法密度敏感的距离度量方法。两个版本的距离方法都能够度的核心所在J。通常将要构建的图需要能够反映数据的量流行上的最短路径,并且能够反映数据集的内在的流行结真实分布,但是图的构建方法却并未取得卓有成效的研究成构。通过使用短边来连接高密度同类样本中的样本点,而用果。大多数基于图的半监督学习算法都是通过高斯函数长边来连接不同的高密度区域之间的样本点。在对这两个来计算两个顶点之间的连接边的权值,即101:版本的密度敏感的距离度量进行了深入分析之后,本文提出:一(1)

8、了一种改进的密度敏感的距离度量方法。并且基于改进的学习算法的性能对参数01比较敏感⋯],并且在处理复密度敏感的距离度量方法,更进一步地提出了一种新的密度杂的现实问题时,这种简单的基于欧几里德距离的相似性度敏感的半监督聚类(anewdensity—sensitiv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。