欢迎来到天天文库
浏览记录
ID:55589029
大小:31.50 KB
页数:4页
时间:2020-05-19
《武大医学统计学期末复习总结(名解和简答).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、医学统计学期末复习总结名词解释参数Patameter:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。统计量statistic:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量实在总体参数附近波动的随机变量。系统误差systematicerror:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的
2、或可能掌握的。随机误差randomerror:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。I型错误typeIerror:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。II型错误typeIIerror:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。P值P-value:在H0成立的前提下,用样本数据获得的样本统计量及比样本统计量总计更极端的区间下的面积。置信区间confidencebound/confidenceinterva
3、l,CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。哑变量dummyvariable:如果是多分类指标,假定有g类,则用g-1个取值为0,1或-1的变量,称为哑变量。偏相关系数partialcorreletioncoefficient:表示在一组变量中,任一两个变量在其它变量固定不变时,他们之间相关的密切程度和方向。或者说,扣除其它变量对它们的影响
4、后,两个变量之间的线性相关情况。决定系数coefficientofdetermination:回归平方与总平方和之比,其数值反映了回归贡献的相对程度,其值约接近1,说明模型对数据的拟合程度越好。随机对照试验RandomizedControlledTrial,RCT:将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。接受者工作特征曲线receiveroperatorcharacteristic,ROC曲线:以不同截断点时的(1-特异度)为横轴,灵敏度为纵轴,作的真阳性率与假阳性率曲线。简答题:1.标
5、准差与标准误的区别与联系。√区别:(1)含义不同:①标准差描述个体变量值x之间变异度的大小,S越大,变量值x越分散;反之变量越集中,均数的代表性就越强;②标准误是描述样本均数之间变异度的大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n关系不同:n增大时,①S-σ(恒定);②标准误减少并趋于0(不存在抽样误差);(3)用途不同:①标准差表示x变异度的大小,计算CV,估计正常值范围,计算标准误等;②标准误:参数估计和假设检验。联系:二者均为变异度
6、指标,样本均数的标准差即为标准误,标准差与标准误成正比。1.数据的分类及统计学方法处理(描述、推断)√数据分类:计数资料(定性资料)、计量资料(定量资料)、等级资料。统计描述:计数资料——相对数(率),结构相对数(构成比)、百分比相对比(OR、RR);计量资料——均数±标准差;等级资料:中位数、四分位数间距等。统计推断:计数资料——卡方检验;计量资料——t检验、方差分析;等级资料——非参数检验。2.样本含量与那些因素有关,是怎样影响的?样本含量的估计取决于:①假设检验的Ⅰ型错误概率α大小:Ⅰ型错误概率α越小,
7、所需样本含量越多。对于相同α,双侧检验比单侧检验所需样本含量多;②假设检验的Ⅱ型错误概率β或检验效能(1-β)的大小:Ⅱ型错误概率β愈小或检验效能(1-β)愈大,所需样本含量愈多;③容许误差δ的大小:容许误差δ愈大,所需样本含量愈小;④总体的相关信息:总体标准差σ愈大,所需样本含量愈多;总体率π越接近0.05,所需样本含量越多;总体相关系数ρ愈小,所需样本含量愈多;变异指标CV愈大,所需样本含量愈多。3.多重回归、logistic回归、Cox回归的区别与联系√多元线性回归、logistic回归、Cox回归的联
8、系:①自变量可以是连续变量、有序分类变量和无序分类变量,为了将无序分类变量代入回归模型,需要进行哑变量彼岸花,哑变量在回归模型中是一个整体,必须同时引入模型或同时从模型中剔除;②当自变量之间存在较强相关关系可能会导致共线性现象;③自变量之间可能会存在交互作用,通常采用两个或两个以上自变量相乘的积作为交互作用项;④均可采用逐步回归筛选变量,其思路均是先考虑单变量分析再进行多元回归分析;⑤均可进行影响因
此文档下载收益归作者所有