肾炎诊断问题

肾炎诊断问题

ID:35016788

大小:665.00 KB

页数:19页

时间:2019-03-16

肾炎诊断问题_第1页
肾炎诊断问题_第2页
肾炎诊断问题_第3页
肾炎诊断问题_第4页
肾炎诊断问题_第5页
资源描述:

《肾炎诊断问题》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、肾炎的诊断摘要本文是一个这是一个判别类型的问题,在医学上是一个诊断问题,即从样本个体的若干个量化特征来判断肾炎与否。我们针对这些信息根据logistic回归分析的相关功能,建立logistic回归分析判别模型。对于样本属性为肾炎与否,这是一个二值响应的问题,我们采用二类样本判别分析方法,即响应变量只有两个值,肾炎时就是1,健康的时候就是0。用logistic模型回归分析处理二类样本判别时,选取阈值0.5,使预报值在阈值0.5上下波动,当预报值大于0.5时则说明样本属性为健康,当预报值小于0.5时则说明样本属性为肾炎。同时利用连接函数logi

2、t将二值响应和影响到样本属性的多因素有机的结合起来,使模型函数化,运用最大似然估计得到函数中的参数,得到一个模型表达式,然后利用这个模型进行判别。在消除logistic回归模型分析中各变量存在的多重共线性上面,我们采用主成分分析法,同样在最后利用得到的新模型进行判别。问题一中通过建立的模型对样本进行检验得出总预测准确率为90%,对问题二中待判别的样本个体进行模型检测时有17个肾炎患者,13个正常人;问题三中对样本进行检验得出总预测准确率为90.91%,对问题四中待判别的样本个体进行模型检测时有17个肾炎患者,13个正常人;综合问题二和问题四

3、,就判别准确率而言,医生应该在检测的时候根据模型中对侧重元素所反映的信息量对样本属性起主要作用的元素进行检测,这样便可以减少检测指标。关键字判别logistic回归分析二值响应二类样本判别分析阈值连接函数主成分分析19/19问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。我们的问题是:1.根据表B.1中的数据,提出一种或多种

4、简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2.按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3.能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4.根据3的结果,重复2的工作。5.对2和4的结果作进一步的分析。问题的假设(1)不考虑化验人体的身高、体重、性别和年龄以及其它方面对记录数据的影响;(2)医生在化验前对被化验的人所做的处理方式都是一样的,比如被检查的人在化验前都不能是空腹;(3)忽略人体内其它元素对问

5、题中七种元素含量的影响;(4)七种元素之间存在着一定的相互关系;符号说明i:被化验的个体;j:被化验的特征,即元素的种类;:代表不同化验特征组合值:19/19:第i个个体的第j个特征值,统计学上叫做协变量;:第i个个体肾炎属性,可取0和1,0代表没有患肾炎,1代表患有肾炎;m:样本中用于分析求解的个体数目;p:特征量为x时属性为肾炎的概率;:模型中各变量的系数(j=0,1,2,3,4,5,6,7);:主成分分析之中的主因子(i(1,2,3,4,5,6,7))问题分析(1)分析题意可知这是一个判别类型的问题,在医学上是一个诊断问题,即从样本个

6、体的若干个量化特征来判断肾炎与否。在统计学上,这是一个所谓的二值响应问题,也称为二类样本判别分析方法,即响应变量只有两个值,肾炎时就是1,健康的时候就是0;(2)问题中已经分别给定30个肾炎病人和30个健康人的训练样区的7个特征Zn,Cu,Fe,Ca,Mg,K,Na的含量数据,根据这些数据确定一个评判模型,然后利用这个模型来协助医生诊断待确定肾炎属性样本个体,最重要的是要保证模型诊断精确度,确保在实际运用中的可信度和可行性,从而有效的预测和判定样本个体的类别属性;(3)由于在化验的过程中,根据问题本身及有关经验,人们罗列出来可能与因变量有关

7、的特征量往往太多(问题中研究的数据中有7个),其中有些变量对因变量可能影响很小或者根本没有影响,如果在最后的指标中把这些变量都包含起来,不但计算量大,而且估计和预报的精度也会降低,也会使这个指标在应用时的费用不必要的增高,因此我们在模型中对进入模型中的特征量做精心的选择是十分必要的;(4)Logistic模型是一种非线性的回归分析模型,它通常是用于预测和判定未知单元的类别属性。Logistic模型这些功能恰好切合以上问题,先根据训练样区,计算出样本个体的肾炎属性与各因子之间的关系式,进而得到肾炎概率分布表达式,选取一定的阈值(0.5),最终

8、在需要化验的样本区域里面确定每个样本的肾炎属性;(5)在建立Logistic模型后,还要消除logistic回归模型分析中各变量存在的多重共线性,即对所选取的特征量进行分类选择,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。