资源描述:
《实验1Fisher线性判别实验.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、个人收集整理勿做商业用途实验1Fisher线性判别实验一、实验目的应用统计方法解决模式识别问题的困难之一是维数问题,低维特征空间的分类问题一般比高维空间的分类问题简单.因此,人们力图将特征空间进行降维,降维的一个基本思路是将d维特征空间投影到一条直线上,形成一维空间,这在数学上比较容易实现。问题的关键是投影之后原来线性可分的样本可能变为线性不可分。一般对于线性可分的样本,总能找到一个投影方向,使得降维后样本仍然线性可分.如何确定投影方向使得降维以后,样本不但线性可分,而且可分性更好(即不同类别的样本之间的距离尽可能远,同一类别的样本尽可能集中分布),就是Fisher线性判别所要
2、解决的问题。本实验通过编制程序让初学者能够体会Fisher线性判别的基本思路,理解线性判别的基本思想,掌握Fisher线性判别问题的实质。二、实验要求1、改写例程,编制用Fisher线性判别方法对三维数据求最优方向W的通用函数.2、对下面表1-1样本数据中的类别ω1和ω2计算最优方向W。3、画出最优方向W的直线,并标记出投影后的点在直线上的位置.表1—1Fisher线性判别实验数据4、选择决策边界,实现新样本xx1=(—0.7,0.58,0。089),xx2=(0.047,—0.4,1。04)的分类。5、提高部分(可做可不做):设某新类别ω3数据如表1-2所示,用自己的函数求新
3、类别ω3分别和ω1、ω2分类的投影方向和分类阈值。个人收集整理勿做商业用途表1—2新类别样本数据三、部分参考例程及其说明求取数据分类的Fisher投影方向的程序如下:其中w为投影方向。clear%Removesallvariablesfromtheworkspace。clc%Clearsthecommandwindowandhomesthecursor.%w1类训练样本,10组,每组为行向量。w1=[—0。4,0.58,0.089;—0。31,0。27,-0。04;-0.38,0。055,-0.035;—0。15,0。53,0.011;-0。35,0.47,0.034;。。.0
4、。17,0.69,0.1;-0。011,0.55,-0.18;-0.27,0。61,0。12;—0。065,0。49,0。0012;-0.12,0。054,-0.063];%w2类训练样本,10组,每组为行向量。w2=[0。83,1。6,-0.014;1.1,1。6,0.48;—0。44,—0。41,0。32;0。047,—0.45,1。4;0。28,0。35,3。1;.。.-0.39,—0。48,0.11;0。34,—0。079,0。14;-0.3,-0.22,2。2;1.1,1.2,-0。46;0.18,—0。11,—0。49];xx1=[-0。7,0.58,0。089]’
5、;%测试数据xx1,为列向量.xx2=[0.047,—0.4,1.04]’;%测试数据xx2,为列向量.s1=cov(w1,1);%w1类样本类内离散度矩阵m1=mean(w1)';%w1类样本均值向量,为列向量s2=cov(w2,1);%w2类样本类内离散度矩阵m2=mean(w2)’;%w2类样本均值向量,为列向量sw=s1+s2;%总类内离散度矩阵w=inv(sw)*(m1—m2);%投影方向y0=(w’*m1+w’*m2)/2;%阈值y0figure(1)fori=1:10plot3(w1(i,1),w1(i,2),w1(i,3),'r*’)holdonplot3(w2
6、(i,1),w2(i,2),w2(i,3),’bo’)end个人收集整理勿做商业用途z1=w'*w1’;z2=w'*w2';figure(2)fori=1:10plot3(z1(i)*w(1),z1(i)*w(2),z1(i)*w(3),’rx’)holdonplot3(z2(i)*w(1),z2(i)*w(2),z2(i)*w(3),'bp’)endholdoffy1=w'*xx1;ify1〉y0fprintf(’测试数据xx1属于w1类');elsefprintf(’测试数据xx1属于w2类');endy2=w'*xx2;ify2〉y0fprintf(’测试数据xx
7、2属于w1类');elsefprintf('测试数据xx2属于w2类');end程序运行结果如图1-1和图1—2所示。图1-1原始数据分布图图1—2线性投影后图形思考问题:空间中一点向某方向投影后(可以以二维空间为例体会这个问题),投影点到坐标原点的距离应是多少?四、实验报告要求1、描述自己对投影方向的理解;2、写出改编的通用函数程序;3、记录实验过程结果,并分析实验中遇到的问题.