欢迎来到天天文库
浏览记录
ID:59374499
大小:34.00 KB
页数:1页
时间:2020-09-04
《欧几里得距离.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、欧几里德空间和距离欧几里德空间(EuclideanSpace),简称为欧氏空间,在数学中是对欧几里德所研究的二维和三维空间的一般化。所谓一般化就是把欧几里德对于距离、以及相关的概念如长度和角度等转换成任意数维的坐标系。欧几里德距离(EuclideanDistance)TheEuclideandistancebetweenpointsandinEuclideann-space,isdefinedas:.设xn和yn分别是n维度量空间中的点,则其欧几里德距离定义为:d(x,y)=(∑(xi-yi)2)1/2当n=2时,则为平面上两点的距离,当n=3
2、时,则为三维空间中两点的距离。2.2.1区间标度变量区间标度变量是一个粗略线性标度的连续变量。用来计算相异度d(i,j),其距离度量包括欧几里德距离,曼哈坦距离和明考斯基距离。首先实现数据的标准化,给定一个变量f的度量值,可以进行一下转化:(1)计算平均的绝对偏差Sf:Sf=(
3、x1f-mf
4、+
5、x2f-mf
6、+……+
7、xnf-mf
8、)/n这里x1f,……,xnf是f的n个度量值,mf是f的平均值。(2)计算标准化的度量值:Zif=(xif-mf)/sf我们知道对象之间的相异度是基于对象间的距离来计算的。最常用的度量方法是欧几里德距离,形式如下
9、:d(i,j)=(
10、xi1-xj1
11、2+
12、xi2-xj2
13、2+……+
14、xip-xjp
15、2)1/2这里i=(xi1,xi2,……,xip)和j=(xj1,xj2,……,xjp)是两个p维的数据对象。曼哈坦距离的公式如下:d(i,j)=
16、xi1-xj1
17、+
18、xi2-xj2
19、+……
20、xip-xjp
21、上面的两个公式必须满足下面的条件:d(i,j)≧0:距离非负。d(i,i)=0:对象与自身的距离为0。d(i,j)=d(j,i):距离函数具有对称性。d(i,j)≦d(i,h)+d(h,j):对象i到对象j的距离小于等于途经其他任何对象h的距离之和。明考斯
22、基距离是以上两中距离计算公式的概括,其具体的公式如下:d(i,j)=(
23、xi1-xj1
24、q+
25、xi2-xj2
26、q+……+
27、xip-xjp
28、q)1/q当q=1时该公式就是欧几里得距离公式;当q=2时,是曼哈坦距离公式。2.2.2二元变量二元变量只有0、1两个状态,0表示变量为空,1表示该变量存在。对象j10Sum对象i1qrq+r0sts+tSumq+sr+tpp=q+r+s+t。二元变量中基于对称的二元变量的相似度称为恒定相似度,这里有最著名的简单匹配系数来评价两个对象之间的相似度,其定义如下:d(i,j)=(r+s)/(q+r+s+t)基于不
29、对称的二元变量的相似度称为非恒定相似度,最著名的评价系数是Jaccard系数,形式如下:d(i,j)=(r+s)/(q+r+s)这里负匹配的数目t被认为是不重要的,所以省略。
此文档下载收益归作者所有