欢迎来到天天文库
浏览记录
ID:35938145
大小:805.85 KB
页数:23页
时间:2019-04-26
《关于某疾病研究问题地数学模型》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、实用文案关于疾病研究问题的数学模型摘要现在与50年前相比,生出一个活泼健康的孩子越来像一个复杂的系统工程,需要精心运作每一个细节,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。本模型就题目给出的鼻炎家族史、主(被)动吸烟等12个因素的相关数据,建立多分类条件Logistic回归分析数学模型,利用SPSS软件包拟合出Sig-显著性(P)的值,再利用逐步回归中的后退法,把所有的变量引入模型,然后逐次把Sig值最大并且Sig>a(a=0.05)的变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的Sig<0.05为止。最
2、后所剩Sig值<0.05所对应的因素:鼻炎家族史,孕期用药,先兆早产,剖宫产和孕期营养即为诱发胎儿疾病的主要影响因素。关键词:疾病Logistic回归分析SPSS软件包Sig(P)值逐步回归后退法标准文档实用文案问题重述世界卫生组织最近发布的资料显示,与50年前相比,人们的生殖能力明显降低了,生一个活泼健康的孩子,越来越像一个复杂的系统工程,需要精心运作每一个细节,不敢稍有松懈麻痹,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。本题就胎儿的某种疾病影响因素做了详细的调查与记录见附表1,根据附表1中的数据,利用统计学知识判断到底该疾病的诱发因素有哪些?一、模型分析考虑到题目给出了病例
3、组与对照组,且给出的多个影响因素为分类变量,不能使用线性回归模型,因此,考虑使用Logistic回归分析数学模型进行了统计分析。在考虑用逐步后退法分析出该疾病的诱发因素。Logistic回归分析数学模型是专门用来分析疾病与危险因素间联系的一种统计方法。假设影响因素对疾病的影响是独立的,利用SPSS软件包输入数据,拟合出Sig值,Sig值为结果可信程度的一个递减指标(即将观察结果认为有效即具有总体代表性的犯错概率)。本模型中取a=0.05(在许多研究领域,0.05的Sig值通常被认为是可接受错误的边界水平)。当Sig4、(0=未患病1=患病)x1:鼻炎家族史(0=无1=有)x2:主(被)动吸烟(0=无1=有)x3:孕早期病毒感染(0=无1=有)x4:孕期用药(0=无1=有)x5:先兆早产(0=无1=有)x6:流产史(0=无1=有)x7:早产(0=无1=有)x8:剖宫产(0=无1=有)x9:孕期营养(0=一般1=好)x10:孕期活动量(0=小1=一般)x11:出生体重(<2.5=12.5~4=2≥4=3)x12:妊娠反应(轻1中2重3)P:在m个自变量的作用下患病的概率:回归系数(j=0,1…12)Si:Sig的检验值Smax:Si的最大值S:Sig的临界值Sig=0.05Sig:“显著性”,当0.015、<0.05,则为差异显著,如果Sig<0.01,则差异极显著。赞同标准文档实用文案四、模型假设1、影响因素对疾病的影响是独立的。2、各个因素的有无影响程度大小不考虑。3、除这12种因素外有可能引起该病的因素不考虑。五、模型建立1、y=1患病;y=0未患病;自变量在m个自变量的作用下患病的概率记作:(1)即:(2)将P作logit转换为,有(3)2、建立似然函数模型:(4)通过,求出,代入(3)得logistic回归方程同时也可求出Sig值。m=12,j=(1,2…200)3、逐步回归的后退法:<1>根据原始数据由SPSS软件得出多元线性回归结果;<2>找到最大的Sig值Smax与临界值S=0.6、05比较,如果Smax>S,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回(1),否则进入(3)。<3>如果SmaxS剔除回归模型SPSS计算查找判断所剩因子六、模型求解:借助于SPSS统计软件完成具体的过程如下:DataView:(数据窗口)(见附表1)VariableView:(变量窗口)再如下:Analyze→Regression→Linear标准文档实用文案再如下:Linea7、r→dependent:yindependent:x1-x12然后单击OK,得:标准文档实用文案以上的Coefficient,为回归参数表。再根据逐步回归的后退法,得:孕早期病毒感染的Sig值最大0.905>0.05,剔除。孕期活动量Sig值最大为0.858>0.05,剔除标准文档实用文案主(被)动吸烟Sig值最大为0.616>0.05,剔除。早产的Sig值最大为0.397>0.05,剔除。标准文
4、(0=未患病1=患病)x1:鼻炎家族史(0=无1=有)x2:主(被)动吸烟(0=无1=有)x3:孕早期病毒感染(0=无1=有)x4:孕期用药(0=无1=有)x5:先兆早产(0=无1=有)x6:流产史(0=无1=有)x7:早产(0=无1=有)x8:剖宫产(0=无1=有)x9:孕期营养(0=一般1=好)x10:孕期活动量(0=小1=一般)x11:出生体重(<2.5=12.5~4=2≥4=3)x12:妊娠反应(轻1中2重3)P:在m个自变量的作用下患病的概率:回归系数(j=0,1…12)Si:Sig的检验值Smax:Si的最大值S:Sig的临界值Sig=0.05Sig:“显著性”,当0.015、<0.05,则为差异显著,如果Sig<0.01,则差异极显著。赞同标准文档实用文案四、模型假设1、影响因素对疾病的影响是独立的。2、各个因素的有无影响程度大小不考虑。3、除这12种因素外有可能引起该病的因素不考虑。五、模型建立1、y=1患病;y=0未患病;自变量在m个自变量的作用下患病的概率记作:(1)即:(2)将P作logit转换为,有(3)2、建立似然函数模型:(4)通过,求出,代入(3)得logistic回归方程同时也可求出Sig值。m=12,j=(1,2…200)3、逐步回归的后退法:<1>根据原始数据由SPSS软件得出多元线性回归结果;<2>找到最大的Sig值Smax与临界值S=0.6、05比较,如果Smax>S,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回(1),否则进入(3)。<3>如果SmaxS剔除回归模型SPSS计算查找判断所剩因子六、模型求解:借助于SPSS统计软件完成具体的过程如下:DataView:(数据窗口)(见附表1)VariableView:(变量窗口)再如下:Analyze→Regression→Linear标准文档实用文案再如下:Linea7、r→dependent:yindependent:x1-x12然后单击OK,得:标准文档实用文案以上的Coefficient,为回归参数表。再根据逐步回归的后退法,得:孕早期病毒感染的Sig值最大0.905>0.05,剔除。孕期活动量Sig值最大为0.858>0.05,剔除标准文档实用文案主(被)动吸烟Sig值最大为0.616>0.05,剔除。早产的Sig值最大为0.397>0.05,剔除。标准文
5、<0.05,则为差异显著,如果Sig<0.01,则差异极显著。赞同标准文档实用文案四、模型假设1、影响因素对疾病的影响是独立的。2、各个因素的有无影响程度大小不考虑。3、除这12种因素外有可能引起该病的因素不考虑。五、模型建立1、y=1患病;y=0未患病;自变量在m个自变量的作用下患病的概率记作:(1)即:(2)将P作logit转换为,有(3)2、建立似然函数模型:(4)通过,求出,代入(3)得logistic回归方程同时也可求出Sig值。m=12,j=(1,2…200)3、逐步回归的后退法:<1>根据原始数据由SPSS软件得出多元线性回归结果;<2>找到最大的Sig值Smax与临界值S=0.
6、05比较,如果Smax>S,剔除Smax对应变量,重新根据余下的变量数据由SPSS软件再得出多元线性回归结果,再返回(1),否则进入(3)。<3>如果SmaxS剔除回归模型SPSS计算查找判断所剩因子六、模型求解:借助于SPSS统计软件完成具体的过程如下:DataView:(数据窗口)(见附表1)VariableView:(变量窗口)再如下:Analyze→Regression→Linear标准文档实用文案再如下:Linea
7、r→dependent:yindependent:x1-x12然后单击OK,得:标准文档实用文案以上的Coefficient,为回归参数表。再根据逐步回归的后退法,得:孕早期病毒感染的Sig值最大0.905>0.05,剔除。孕期活动量Sig值最大为0.858>0.05,剔除标准文档实用文案主(被)动吸烟Sig值最大为0.616>0.05,剔除。早产的Sig值最大为0.397>0.05,剔除。标准文
此文档下载收益归作者所有