资源描述:
《【精品】数模第二组第五队论文.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、摘要木题是一个由实际问题的医学诊断问题抽象出来的数学模型,通过对确诊人员7种元索含量的分析得出判别方法,并且应用于判断,最后对结果进行进一步的分析与简化。对于问题1,首先根据部分所给已确诊的病例样本,分别用Logistic回归分析法.Mahalanobis距离判别法和Fisher判别法得出根据Zn,Cu,Fe,Ca,Mg,K,Na7种元素的含量判别肾炎病人或非肾炎病人的判别函数,然后将余下已确诊的病例化验结果数据回代入判别函数中,得到Logistic回归分析法回代准确率为85%,Mahalanobis距离判別
2、法回代准确率为95%,Fisher判别法的回代准确率为90%;因此对于问题2,我们选用凹代准确率最高的Mahalanobis距离判别法判定表二中的3()名就诊者是肾炎病人还是非肾炎病人;我们将表二中的就诊人员的化验结果数据代入Mahalanobis判别模型,得出结论为:健康者编号:63,67,70,74,75,77,7&80,81,82,84,86,87,88,89,90;肾炎者编号:61,62,64,65,66,6&69,71,72,73,76,79,83,85。对于问题3,耍确定哪些指标是影响人们患肾炎的
3、主要因素,我们采用主成分分析法以及显著性检验进行分析判断,得出4种主要元素分别是Cu、Fe、Mg、Ca,即为影响是否患肾炎的主耍元素;对于问题4,根据问题3得岀的主元素,重新利用Mahalanobis距离判别法进行判断,对表二中的30名就诊者判断结果为:健康者编号:63,67,66,70,71,74,77,7&80,81,82,84,86,87,88,89,90;肾炎者编号:61,62,64,65,68,69,72,73,75,76,79,83,85。对于问题5,通过比较问题2和问题4的结果,对相似度的分析,
4、对其冋代准确性的分析,联系现实中的情况,得出结论:4种主相关元索判断优于7种元素的判断。关键字:Logistic回归分析法Mahalanobis距离判别法Fisher判别法主成分分析法显著性检验目录%1.问题的重述-1-%1.问题的分析-1-1.问题1、问题2的分析-1-2.问题3、问题4的分析-4-3.问题5的分析-5-%1.模型的假设-5-%1.符号的说明-5-%1.模型的建立与求解-6-1.模型的建立-6-2.模型的求解-9-%1.参考文献-18-%1.附录-18-・问题的重述人们到医院就诊吋,通常要化
5、验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表1是确诊病例的化验结果,其屮1・30号病例是己经确诊为肾炎病人的化验结果;31・60号病例是已经确定为健康人的结果。表2是就诊人员的化验结果。我们需耍解决的问题是:1.根据表1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提岀方法的正确性。2.按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3.能否根据表1的数据特征,确定哪些指标是影响人们患
6、肾炎的关键或主要因素,以便减少化验的指标。4.根据3的结果,重复2的工作。5.对2和4的结果作进一步的分析。病例表见附录。—.问题的分析1.问题1、问题2的分析根据表1所给的数据,通过分析就诊者体内7种元素Zn,Cu,Fe,Ca,Mg,K,Na的含量,我们可将就诊者的身体状况分为患病(肾炎)和健康(非肾炎)2种情况。很显然,这7种元素含量的数据是属于二分类变量类型。我们就耍通过对己知的3()个患病者和30个不患病者7种元素含量的分析来找到一种判断患病与不患病的具体方法,进而预测就诊者是否患病,先用作图的方法对
7、7种元素与患病与否的关系做一个直观的展示:加含量分析图病例号♦病人T-健康人Cu含量分析图令二T-病人—健康人病例弓"含量分析图病例0令二£—♦—病人•-•一他康人Cel含量分析图病例号—病人-•—健康人Mg含量分析图T-病人T~健康人K含量分析图病例号—♦—病人■彳建康人Na含量分析图病例号T—病人T—健康人通过对图的了解,经过查阅资料,我们知道对此类问题可以运用Logistic回归分析法、Mahalanobis距离判别法和Fisher判别法进行判别。对TLogistic回归分析法,这是一个多元线性的问题,
8、7种微量元素的数值心,作为7个口变量,而是否患病的判別概率〃,作为因变量。引入随机变量q,q可看成心的线性函数,运用〃的Logistic变换,即可得到p的Logistic回归方程,根据此模型便可计算出就诊者的健康概率。在此模型屮,若概率为0,则就诊者患病;若概率为1,则就诊者健康。对于Mahalanobis距离判别法,我们可根据确诊病例的化验结果列出观测矩阵及样本容量,从而计算出样木的均值向量和各总