资源描述:
《卫生统计学 判别分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十六章观察对象的分类分析方法---------判别分析(DiscriminantAnalysis)1主要有判别分析和聚类分析判别分析:事物的分类是清楚的,目的是通过已知分类建立判别函数,预测新的观察对象所属类别。聚类分析:事物分类不清楚,分几类不清楚,目的希望将事物进行分类(探索性研究)。事物分类的统计方法:2判别分析(discriminantanalysis)是在已知分为哪若干类的前提下,通过现有数据建立判别方程(函数),根据对象若干个指标的观测结果判定其应属于哪一类的多元统计学方法。常用的判别分析的方法有Bayes判别、Fisher判
2、别、非参数判别、最大似然判别等。当事先并不知道观察对象应分为哪若干类别时,采用聚类分析方法进行分类。一、判别分析的基本概念3与聚类分析有所不同的是:判别分析法首先需要对所研究对象进行分类,进一步选择若干对观测对象能够较全面地描述的变量,建立判别函数。对一个未确定类别的个案只要将其代入判别函数就可以判断它属于哪一类总体。4二、医学中的分类问题:1.疾病诊断例:用电感耦合等离子体发射光谱法测定肺癌患者和健康人尿液中的铬、铁、锰、铝、镉、铜、锌、镍,用原子荧光光谱法测定硒。对肺癌患者和健康人尿液中9种微量元素进行判别分析,为肺癌的早期诊断提供科学
3、依据。----陈丹丹等.对肺癌患者和健康人尿液中9种微量元素的判别分析.药物分析杂志.2009,29(6).5预测病人的预后(好或差),提出早期治疗方法,降低严重后果。例如根据新生儿出生后1分钟阿氏评分(X1)、窒息复苏时间(X2)、惊厥持续天数(X3)、急性期CT改变(X4)及治疗3天后原始反射情况(X5)判别新生儿缺血缺氧性脑病的预后(脑性瘫痪、严重智能低下、正常)。2.疾病的预测6用途:通过数据建立判别方程,对研究事物进行分类和预测。对资料要求:要求建立方程的观察对象分类(y)已经明确(用金标准确定),收集建模对象(训练样本)的m个变
4、量(x)建立判别方程。三、判别分析的特点7根据自变量(x)资料性质:自变量(x)为定量数据:Fisher判别、Bayes判别(SPSS、SAS统计软件可实现)。自变量(x)为定性数据:最大似然判别法、Bayes公式判别(统计软件不能自动实现)。四、判别分析建模的方法8五、判别分析方法的基本步骤1.建立判别函数(方程)2.规定判别(分类)准则判别新个体为某类3.评价判别方程的效果9主要用于定量数据的两类或多类判别.Bayes判别的思想:基于Bayes准则,假定已知各类出现的先验概率P(Yk),且各类变量近似服从多元正态分布,获得Bayes判别
5、函数。计算各个体出现的后验概率进行判别。第一节Bayes判别10一、分析步骤1.筛选判别指标选择其中相互独立的部分指标建立判别函数.在建立判别函数之前,要先进行逐步判别分析,筛选出主要的判别指标,然后再对主要的判别指标作判别分析.SAS中的STEPDISC过程用来筛选判别指标,用Wilks’Lambda统计量及对应P值来衡量.11决定某变量是否入选:以已进入模型的变量作为协变量,将待考察的某变量作为应变量,以各类别作为对比组,采用协方差分析来判断扣除协变量的影响后,待考察的变量在各类别间有无差别。如果有差别,待考察的变量可进入方程;反之,则
6、不能入选。12协方差分析:将对应变量Y有线性影响但未加控制或难以控制的定量变量X看做协变量,把X化为相等后比较各组Y的修正均数,是线性回归与方差分析结合起来的一种统计分析方法。模型中无任何变量时即为方差分析。132.建立Bayes判别函数已知判别对象分为g类,有m个判别指标Xj(j=1,2,…,m),要求各类的m个判别指标均近似服从多元正态分布。当各类的协方差矩阵相等时,计算合并协方差矩阵,表示判别指标Xi、Xj的合并协方差,按公式(16-1)计算。14表示第k类中变量Xi、Xj的均数;nk为第k类的例数15求解(k=1,2,…,g)由16
7、计算为第k类(k=1,2,…,g)出现的先验概率,当不知道各类的先验概率时,一般取等概率1/g,也可取频率(当样本较大且无选择性偏倚)。17建立线性Bayes判别函数:(j=0,12,…,m;k=1,2,…,g)为需要估计的参数,用SAS的DISCRIM过程可得到这些参数的估计值。18当各类的协方差阵不等时,应计算非线性二次型Bayes判别函数,在SAS的DISCRIM过程名后加选项POOL=TEST,SAS先经过检验,若各类的协方差阵满足齐性,则合并且给出线性Bayes判别函数;若各类的协方差阵不满足齐性,则不合并,且自动用非线性二次型B
8、ayes判别函数取代线性Bayes判别函数。193.确定判别规则(1)按判别函数值判别:对每一个判别对象,将其m个判别指标的取值分别代入g个判别函数,计算判别函数值,将判别对象判