欢迎来到天天文库
浏览记录
ID:6233049
大小:10.49 MB
页数:59页
时间:2018-01-07
《十三章 分类资料回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十三章分类资料回归分析(Regression)13.1分类资料回归分析方法概述分类资料回归分析(regressionofcategoricaldata)是针对因变量为分类资料的一类回归分析方法,。常用的Logistic类回归(Logisticregression)属于概率型非线性回归,是一类研究因变量为二分类或多分类观察指标与一些“危险因素”(自变量)间关系的多变量统计分析方法。本章主要介绍二分类Logistic回归、多分类Logistic回归、有序Logistic回归和概率单位回归。在医学科研或日常工作中,有关疾病的动物实验研究、临床试验研究和流行病学研究的许多资料如动物实
2、验结果(生存与死亡)、健康体检结果(患病与未患病)、胃组织病理检查(胃炎、不典型增生、癌变)、病人治疗结果(治愈、显效、有效、无效)等均属于分类资料,这类资料是根据资料的类型、性质或属性分类后清点各组所得资料,根据分类情况可以分为无序分类(unorderedcategoricaldata)和有序分类资料(ordinalcategoricaldata),无序分类资料可以分为二分类资料(binarycategoricaldata)和多分类资料(multiplecategoricaldata)。根据设计类型可以分为完全随机设计的成组资料和配对设计的配对资料。分类资料回归分析用Logi
3、stic回归分析,Logistic回归分析可以分为二分类Logistic回归分析(binaryLogisticanalysis)、多分类Logistic回归分析(multinomialLogisticanalysis)和有序Logistic回归分析(ordinalLogisticanalysis)等,二分类Logistic回归分析可以分为非条件Logistic回归分析和条件Logistic回归分析,主要用于应变量为二分类资料。多分类Logistic回归分析主要用于应变量为无序多分类资料,有序Logistic回归分析主要用于有序多分类资料。一、常用术语1.回归系数假设检验统计量1
4、.Logistic回归Logistic回归(Logisticregression)是属于概率型非线性回归,适用于研究因变量为二分类或多分类观察指标与一些“危险因素”(自变量)间关系的多变量统计分析方法。2.数量化或哑变量数量化是将观察项目的内容用数值表示出来,如性别为研究的变量时,男性可用1表示,女性用2表示。将观察指标的内容重新用数值编码形成的变量称为哑变量(dummyvariable),如年龄(实际数值)化为哑变量“年龄2”(1:<20岁;2:20~40岁;3:40~60岁;4:>60岁),文化程度(1:文盲;2:小学;3:初中;4:高中;5:中专;6:大专;7:本科;8:
5、硕士研究生;9:博士研究生)化为哑变量“文化程度2”(1:中专或高中及以下;2:大专及以上)。31.(1)Wald检验59Wald检验(Waldtest)是对回归系数β的假设检验,通过估计β的标准误、再比较b与0的差别来进行,其检验统计量服从分布,计算式为:(13-1)(β的95%可信区间为:b±1.96SE(β)(13-2)OR的95%可信区间为:eb±1.96SE(β)(13-3)42).似然比检验用于比较两个模型的拟合效果。检验统计量为:G=-2lnL-(-2lnL’)。其中L是模型1的似然函数,L’是模型2的似然函数。模型1含有较少自变量,模型2不仅含有模型1的自变量,
6、该统计量也服从分布该统计量服从。原假设为模型1和模型2拟合效果无改变;备择假设为模型1和模型2拟合效果有改变。似然比检验既适合单个自变量的假设检验又适合多个自变量的同时检验。(Logistic回归模型的估计一般采用的是最大似然法,即使模型的似然函数G达到最大值。似然比检验(likelihoodratiotest)是通过比较两个互相嵌套模型的对数似然函数统计量G,-2lnL被称为Deviance,简称D。似然比检验统计量为:G=Dp-Dk=-2×(模型p的对数似然函数-模型k的对数似然函数)≈(13-4)53).比分检验比分检验(scoretest)是以未包含某一个或几个变量的模
7、型为基础,保留模型中参数的估计值,并假设新增加的参数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。当样本含量较大时,S的分布服从分布。42.相对危险度和优势比数比相对危险度(relativerisk,RR)是表示暴露在某危险因子下的发病率与不暴露在某危险因子下的发病率的比值。其公式为:(13-52)优势比(oddsratio,OR)是表示暴露在某危险因子的发病率p1与不发病率(1-p1)之比与未暴露在某危险因子下的发病率p2与不发病率(1-p2)之比
此文档下载收益归作者所有