判别分析discriminantanaly

判别分析discriminantanaly

ID:39326557

大小:342.32 KB

页数:20页

时间:2019-06-30

判别分析discriminantanaly_第1页
判别分析discriminantanaly_第2页
判别分析discriminantanaly_第3页
判别分析discriminantanaly_第4页
判别分析discriminantanaly_第5页
资源描述:

《判别分析discriminantanaly》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、判别分析(discriminantanalysis)判别分析是根据对象若干个指标的观测结果判定其应属于哪一类的统计学方法。临床常需要根据患者的主诉、体征、检查结果等做出诊断。如对急腹症的患者,需要诊断患病原因。诊断阑尾炎时需要与其它急腹症作鉴别诊断。确诊为阑尾炎后还需诊断属何种类型,如是否并发腹膜炎、是否穿孔等,以确定治疗方案。判别分析的目的是通过筛选具有判别能力的指标,建立判别函数,以便用于对新样品的分类。经典的判别分析有Fishes判别和Bayes判别。近年来,这些方法又有了新发,展,同时也不断有学者提出一些新的方法。第一节Fishes判别Fishes判别又称典则判别(canonicald

2、iscriminant),适用于两类和多类判别。一、两类判别1、Fishes判别的原理  已知A、B两类观察对象,A类有nA例,B类有nB例,分别记录了X1,X2,…,Xm个观察指标,称为判别指标或变量。Fishes判别法就是找出一个线性组合使得综合指标Z在A类的均数与在B类的均数的差异  尽可能的大,而两类内综合指标Z的变异   尽可能小,即使         达到最大,这就是Fisher准则。2、判别规则  建立判别函数后按判别公式逐例计算判别函数值Zi,进一步求Zi的两类均数判别规则:二、判别效果的评价判别效果一般用误判率P来衡量。一般要求判别函数的误判率小于0.1或0.2才有应用价值。

3、误判率可通过前瞻性或回顾性两种方式获得估计。所谓回顾性误判率估计是指用建立判别函数的样本回代判别。回顾性误判率估计往往夸大判别效果,一般而言,建立判别函数前要将样本分成两部分,分别占样本总量的85%与15%。前者用于建立判别函数,称为训练样本,后者用来考核判别效果,称为验证样本。 用验证样本计算的误判率作为前瞻性误判率估计,前瞻性误判率估计则较为客观。另外一种值得推荐的误判率估计的方法称为刀切法或称为交叉核实法。它的具体步骤为:1)顺序剔除一个样品。用余下的N-1个样品建立判别函数;2)用判别函数剔除样品;3)重复上两步N次。计算误判别率。这种估计的优点是充分利用了样本信息对立和验证判别函数。

4、三、多类判别   多类Fisher判别原理与两类Fisher判别相似,假定有g类,就要建立g-1个的判别函数。尽管多类Fisher判别理论完备,但由于其判别规则相对复杂,很少付诸应用,故不作进一步介绍。第二节  最大似然判别法   最大似然判别法又称尤度法,适用于指标为定性指标的两类判别或多类判别。1、判别原理  用独立事件概率乘法  定理得到判别对象归属某类概率。   若m个判别指标记为X1,X2,…Xm,,有g类记为Y1,Y2,…Yg。m个指标互相独立,g种类型互斥(即每个判别对象只可能归属其中一类).假定已知属于第k类时变量Xj取值sl条件概率为当某例的各指标X1,X2,…Xm分别取值S

5、l(指各指标取各自的一个状态),似然函数为: 判别规则求p=Max(pk),如果p=pk0即被判为第k0类。3、最大似然法的应用 例有人试用7个指标对4种类型阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表18-3如某病例昨晚开始出现右下腹痛、呕吐等症,大便正常。经检查,右下腹部压痛,肌性防御(+)、压痛(+),体温36.60C,白细胞23700。根据表18-3第三节Bayes公式判别法1、判别原理用Bayes公式进行判别分析与最大似然法原理相似。若已知有g类记为YK,m个指标Xj的状态记为Sl。假定某判别对象(记为a)各指标Xj的状态分别取为S,则该对象a属于第K类的后验概

6、率为:2、判别规则将判别对象为最大的那一类。 例资料见表,用四种类型阑尾炎病人的构成比作为先验概率p(Yk)的估计。 卡他性型阑尾炎20%蜂窝织炎型阑尾炎50%坏疽型阑尾炎25%腹膜型阑尾炎5%第四节Bayes判别 前三节分别介绍了Fisher判别,最大似然判别和Bayes公式判别。Fisher判别是寻找合适的投影方向,使样本在投影面上类内变异变小,类间变异增大,达到判别目的;而后两种方法是以概率为判别为依据的,要求训练样本较大,否则判别效果难以保证。 本节介绍基于Bayes准则的判别法,该方法仍然是根据概率大小进行判别的,要求各类服从多元正态分布。多类判别多采用此方法1、Bayes准则寻找一

7、种判别规则使得属于第k类的样品,在第k类中取得最大的后验概率。基于准则,假定已知各出现先验概率P(YK),且各类服从多元正态分布,可获得两种Bayes判别函数。1)当各类的协方差阵相等时,可得到线性Bayes判别函数:2)当各类的协方差阵不等。得到非线性二次型Bayes判别函数,不作介绍2、先验概率的确定1)等概率(先验无知):P(YK)=1/g;2)频率:P(YK)=nk/N 3、判别规则:1)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。