多元统计分析 第5章(判别分析)

多元统计分析 第5章(判别分析)

ID:34059732

大小:757.18 KB

页数:153页

时间:2019-03-03

多元统计分析 第5章(判别分析)_第1页
多元统计分析 第5章(判别分析)_第2页
多元统计分析 第5章(判别分析)_第3页
多元统计分析 第5章(判别分析)_第4页
多元统计分析 第5章(判别分析)_第5页
资源描述:

《多元统计分析 第5章(判别分析)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实际案例1在流行病研究中,调查研究死者的死亡原因.城市死者的死亡原因一般是知道的,作为训练样本,通过向死者的亲属进行问卷调查得到相关的数据;农村死者的死亡原因通常是未知的,或者可能是不准确的,同样可以向死者的亲属进行问卷调查得到相关的数据,进而判断死者的死亡原因.1实际案例22010年6月13日,浙江省金华警方从福建厦门带回了两名犯罪嫌疑人,他们通过音频软件,破译出了别人的银行卡账号和密码,转走了卡里的8万多元.问题:这和判别分析有什么关系?问题关键:电话银行转帐——用手机录下了电话按键音——用音频软件分析出银行卡账号和

2、密码2案例2训练样本:犯罪嫌疑人的银行账户,银行服务电话的号码,选择服务的号码.待判观测:受害人的银行卡账号和密码.变量:振幅高低和音频大小3ò医学诊断ò判断一种新植物属于哪一类ò气象学中的气象诊断ò经济学中判断一个国家经济发展程度所属类型ò股票下周是涨还是跌ò考古学中ò体育运动中判断运动员的类型ò教育学中判断某个学生的类型ò……4教材中的例子P142-例5.1.1(盐泉含钾性判别)P153-例5.2.1(胃癌的鉴别)典型案例Fisher于1936年发表的鸢尾属植物数据已作为判别分析和聚类分析的典型案例.萼片的长、宽和花

3、瓣的长、宽都可以视为随机变量,记为SEPALLEN,SEPALWID,PETALLEN,PETALWID以毫米为单位.样本取自三个品种,各取50个样品,由此建立判别函数.5判别分析的实际背景已知k个总体G,G,…,G,现有12k一个样品X,要判别它来自上面k个总体中的哪一个.原理?合理性?判错概率?mm设样品X∈R,把R划分成k部分D,D,",D,则判别准则为12kX∈G如X∈D,t=1,2,",ktt6判别分析的模型YX训练样本已知已知待判个体未知,希望已知知道(1)Y是名义变量.(2)X通常是多维连续型变量,比如假定

4、服从正态分布.7第五章判别分析§5.1距离最小判别准则§5.2后验概率最大判别准则§5.3平均损失最小判别准则§5.4Fisher判别§5.5逐步判别8降维选变量判别准则平均损失最小后验概率最大距离最小9§5.1距离最小判别准则距离判别的基本思想:样品和哪个总体距离最近,就判它属哪个总体.距离判别也称为直观判别法.问题:如何定义样品到一个总体的距离?10一、马氏(Mahalanobis)距离定义5.1.1(马氏距离)设总体G为m维总体,均值向量为μ,协差阵为Σ,则样品X与总体G的马氏距离定义为:2−1d(X,G)=(X−

5、μ)′Σ(X−μ)22(x−μ)当m=1时,d(x,G)=2σ点到类的距离11二、两总体的距离判别m两个总体G和G,样品X∈R,样品到每个1222总体的距离d(X,G)和d(X,G),判别规则:1222⎧X∈G如d(X,G)≤d(X,G)⎪112⎨22⎪⎩X∈G如d(X,G)>d(X,G)21222⎧X∈G如d(X,G)d(X,G2)⎪22⎪⎩待判如d(X,G1)=d(X,G2)12当总体的数学期望和协方差阵未知时,用训练样本的数字特征代替总体的数字特征.22−1

6、d(X)=d(X,G)=(X−μ)′Σ(X−μ)iiiiiS(i)iX13训练样本:(i)()(i)(i)(i)′X=x,x,",x(i=1,2;t=1,2,",n),(t)t1t2tmi(1)(1)(1)即:X,X,",X来自G;(1)(2)(n1)1(2)(2)(2)X,X,",X来自G.(1)(2)(n2)2ni(i)1(i)X=∑X(t)估计μi,nit=11()(i)S=A=s估计Σ,iiljm×min−1ini(i)(i)(i)(i)其中Ai=∑(X(t)−X)(X(t)−X)′t=114当Σ=Σ=Σ时,协差

7、阵Σ的估计1221S=n−2∑Ai=()sljm×mi=1n=n+n12151.当总体协差阵相等(Σ=Σ=Σ)时:122(i)−1(i)d(X,G)=(X−X)′S(X−X)i−1⎡−1(i)1(i)−1(i)⎤=X′SX−2X′(SX)−(X)′SX⎢⎥⎣2⎦−1=X′SX−2Y(X)(i=1,2)i2d(X,G)小⇔Y(X)大其中ii−1(i)1(i)−1(i)Y(X)=X′(SX)−(X)′SXi216−1(i)1(i)−1(i)Y(X)=X′(SX)−(X)′SXi22d(X,G)小⇔Y(X)大iiYX()称为线

8、性判别函数,i−1(i)aSX=称为判别系数向量,i1()ii−1()cX=−()′SX称为常数项.i2SAS输出判别系数和常数项1722d(X,G)−d(X,G)21(2)−1(2)(1)−1(1)=(X−X)′S(X−X)−(X−X)′S(X−X)=2Y(X)−2Y(X)12⎡−1(1)1(1)−1(1)−1(2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。