欢迎来到天天文库
浏览记录
ID:52329474
大小:1.18 MB
页数:42页
时间:2020-04-04
《现场调查资料的数据分析与表达.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、现场调查资料的数据分析与表达毛广运环境与公共卫生学院目的与要求掌握数据处理的基本原则统计方法选择的基本思路各种常用统计方法的前提适用条件熟悉统计描述和统计推断统计图和统计表了解统计报告提纲数据处理的一般原则与基本内容统计方法选择的基本思路常见调查研究方法资料的统计分析调查资料统计分析结果的表达知识回顾研究设计非正态:M(QL~QU)非参数检验资料收集统计分析研究报告统计推断统计描述定量资料分类资料正态:X±S率、构成比假设检验参数估计参数检验点值估计区间估计-第一节数据处理的一般原则与基本内容数据处理方法的变迁手工计数手工计算算盘计算计算器程序计算机软件数据处理数据
2、处理定义:对数据的采集、存储、检索、加工、变换和传输。基本目的:从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。组成数据管理(约占全部工作量的60%-80%)数据分析(约占全部工作量的20%-40%)数据处理的一般原则与基本内容数据库设计数据录入数据管理数据审核异常(缺失)值的处理统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。数据分析统计方法的选择统计描述与统计推断数据库设计变量(研究指标)识别变量:用于数据管理的变量,如ID分析变量:根据研究
3、目的而定、需进行数据分析反应变量:反应疗效/观察结果变化情况的变量解释变量:分组(类)变量或协变量数据:变量的测量值空白数据库事先设计、用于容纳具体数据的容器,多为二维结构常由Epidata、Excel等专用软件设计数据整理的内容数据库数据审核异常/缺失值处理分组/汇总统计图/表数据审核(非常重要)定义对搜集到的资料进行认真的审查和核实目的确保资料符合要求、完整、准确无误方法逻辑审核(手工或计算机检查,以避免逻辑错误,如男性怀孕等)计算审核(多为计算机检查,如白细胞总量=酸+碱+淋巴细胞)离群数据的处理离群数据严重偏离群体平均水平的数据,多为错误(如DBP=880m
4、mHg),少量为异常的真实值可严重掩盖事实真相或扭曲两者间的关系处理原则手工处理:正态分布:>3×
5、均数±标准差
6、偏态分布:>99.5%或<0.5%软件处理箱式图:距箱体底线或顶线距离超过箱体高度1.5~3倍者缺失数据的处理缺失值部分研究指标记录不完整,导致其值缺失后果:导致研究效率的下降数据的常见缺失机制完全随机缺失:缺失资料与完整资料的特征无显著性差异非随机缺失:缺失资料与完整资料的特征存在显著性差异常见处理措施直接剔除:适用于缺失量极少且为完全随机缺失单独列为一类:适用于缺失量较大,且难以合理填补者缺失值填补:均数替代中位数替代最后观察值结转回归算法多重填补法
7、统计方法前提条件的检查与描述统计学最难以掌握之处数据分析人员最应该首先掌握的技能熟悉各种统计方法的前提适用条件合理选择最合适的统计方法第二节统计方法选择的基本思路统计方法选择的核心要素研究目的组间差异显著性检验?优效性检验?等效性检验?非劣效性检验?相互关系相关与回归、关联性分析(OR、RR、AR)、其它设计类型完全随机设计?配对设计?随机区组设计?数据类型计量资料?分类资料?等级资料?分布特征正态分布?对数正态分布?其它偏态分布?统计方法选择总结统计方法选择总结(续)统计方法选择总结(续)常见统计分析的错误普查还是抽样调查?普查无统计推断随机抽样还是非随机抽样?非
8、随机抽样不能使用普通的统计推断方法资料类型误认未能满足所选择统计的前提适用条件单因素ANOVA代替重复测量资料的方差分析第三节常见调查研究方法资料的统计分析横断面研究定义研究某一特定时点(时期)、特定范围内人群中的有关变量(因素)与疾病或健康状况的关系资料既不反映既往又不反映将来数据处理资料审核、查漏补缺、去除重复记录等三间分布:时间分布、地区分布、人间分布统计描述:均数、标准差、95%CI、率、构成比等统计推断:单一变量组间比较、两(多)变量间关系分析队列研究的原理由“因”索“果”队列研究资料的数据分析资料审核与数据管理统计描述研究对象构成、随访次数、随访间隔、结
9、局及失访情况等分组(研究组别、年龄、性别等)整理随访期间的结局(发生率/死亡率)情况计算组间比较的RR、AR、PAR(归因危险度百分比)、PARP(人群归因危险度百分比)统计推断推断暴露因素与结局是否有关病例对照研究的原理由“果”索“因”病例对照研究资料的数据分析资料审核与数据管理统计描述研究对象的一般特征等组间均衡性比较不均衡:分层分析计算组间比较的OR非匹配资料不分层分析:OR=ad/bc分层分析:合并OR=ORi、95%CI合并OR、2值、P值匹配资料:单元格中的数字乃为对数统计推断推断暴露因素与疾病是否具有统计学关联干预性研究的原理(附加内容)干预性
此文档下载收益归作者所有