欢迎来到天天文库
浏览记录
ID:22768587
大小:340.02 KB
页数:25页
时间:2018-10-31
《判别分析精品课程》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第七章判别分析 判别问题在日常生活中很常见:在河里逮住一条怪鱼,要判别它是哪种鱼,这是判别问题;一个非婚生子女,判别他的父亲是否某人,这是判别问题;从今年春天气象资料预报今年夏天是偏热、偏冷还是正常,也是判别问题。判别问题的特点是,事先已知若干个类,今有一个样本,需要判别它属于哪一类。解决判别问题有多种方法,例如观测鱼的特点,DNA鉴定等。多元统计分析的判别分析方法则是从可观测的多个指标出发。例如已知某地第二年汛期雨量偏大、偏小与正常这三种情况取决于第一年10个气象指标。我们想建立从10个气象指标预报第二年雨量是否正常的公式,于是我们把第二年雨量分为三类,建立判
2、别法则:用前一年10个气象指标判定第二年属于哪一类。这10个气象指标也可称为10个预报因子,第二年雨量类型作为预报对象。从预报因子预报对象的类型来看,判别分析的预报因子是数值变量,预报对象是属性变量。从多元统计分析的角度来看,每个预报因子作为一个随机变量,所有预报因子作为随机向量,每一类作为一个总体,由均值的不同确定不同类。7.1数学模型与判别方法 例7.1已知长江中游6月份降水分为三级:偏少、偏多、正常,分别用1,2,3来表示这三个母体(用变量species=1,2,3表示)。现利用气象因子x1,x2,x3,x4为预报因子(随机向量)作判别,1951-1975年观测数据(已分
3、好类)见表7.1。1976-1979x1,x2,x3,x4年数据已知,不知分类(待分类)见表7.2。试利用1951-1975年资料所得判别方法判定1976-1979年长江中游6月份降水级别。表7.11951-1975长江中游6月份降水及气象因子x1,x2,x3,x4的值yearx1x2x3x4species19510.5882.044.040.6119520.4083.018.043.0219530.5585.036.030.7219540.4085.036.040.7219550.4888.049.043.0219560.4182.035.078.6319570.6580.029
4、.033.2119580.4582.032.033.132519590.3981.027.046.5319600.3485.028.041.7319610.4284.038.020.4319620.5286.038.00.2119630.4688.025.056.7219640.4883.046.013.6119650.5384.041.032.3119660.6581.031.028.9119670.6683.038.046.6119680.5380.042.093.1319690.5685.018.016.3319700.4583.037.023.9319710.3480.04
5、2.026.3319720.4179.038.040.8319730.5383.023.061.3319740.4884.019.023.2219750.3085.027.017.52 表7.21976-1979长江中游x1,x2,x3,x4的值yearx1x2x3x419760.4281.021.052.219770.5281.038.045.819780.3682.034.034.919790.4384.034.060.5多元统计判别把预报因子看成随机向量,每一类看成一个总体。判别分析的数学模型是:设有k个总体,(这k个总体通常称为k个类)。它们分别服从多元正态分布,,
6、…,其中,…是已知或未知向量,..是已知或未知矩阵,每次观测是一个样品。今有一观测向量X(样品),需要判定X来自k个总体中的哪一个(属于哪一类)。25实际问题中,…,…总是未知的,但我们知道每个总体的若干个样品:第一类样品,…,…第k类样品,…。从而可以分别计算每类样本均值(也称为j类均值),和样本方差阵(也称为i类样本方差) (7.1)用它们代替各总体的均值和方差阵。判别分析的方法很多,诸如距离判别法,最大概率判别法等,由于,,…,…,…,都是随机变量的观测值.因而存在误判问题。我们这儿对误判问题不作讨论,仅介绍这些方法。1.欧氏距离判别:计算X与第j个总体均值
7、的欧氏距离,也称为X与第j个总体的欧氏距离;判定X属于距离最小的一类。一般情况总是未知的,用样本均值代替,即计算X与第j个总体样本均值的欧氏距离,判定X属于距离最小的一类,即X来自距离最小的总体。欧氏距离判别计算简单,不用SAS软件也能很快编程(如C语言编程),非常方便。但由于欧氏距离与样品各分量单位有关,例如长度分量由cm为单位,改为mm为单位,长度分量数值扩大10倍,其影响扩大10倍,而重量分量由g改为kg,重量分量的影响缩小1000倍;而且有些相互联系的分量都作
此文档下载收益归作者所有