spss实习指导

ID：45757661

大小：217.18 KB

页数：33页

时间：2019-11-17

资源描述：

《spss实习指导》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、一、数据库建立的一般原则与方法㈠数据库的建立方法统计工作分为研究设计、收集资料、整理资料和分析资料四个步骤，资料的收集是科研工作的基础。现代医学的发展使得医学科研方法日趋多元化，医学科研工作屮的数据越来越呈现大型化的趋势，即收集的样本含量和研允的变量数越来越多，如大规模的流行病学调研或多中心临床对照试验等。随着计算机应用技术的发展和普及，统计分析方法的不断深化，医学科研数据的分析处理越来越依赖于计算机完成。从上世纪60年代起，大型的统计软件如SAS、SPSS、STATA等以其强大的功能，便捷的操作，日趋完善的性能，给人们进行数据处理带来了很大的方便，使过去很长时I'可才能完成的

2、计算在瞬间就能实现。因此，使用统计软件进行分析Z前，保证将原始数据规范、准确、完整的录入数据库，是资料分析过程中的重要环节。医学科研的原始数据大多可用一种统一的数据结构表达，如表1所示。在表1中，每一行称为一个记录（record）或一个观察单位（case）,记录每一个研究个体的各研究指标；每一列称为一个变量（variable）,表示研究中的各研究指标。横向的纪录和纵向的变量构成了常见的二维数据方阵。表1某地2005年630例65岁以上老年人健康体检纪录编号姓名性别年龄（岁）民族腫(kg):射(cm)高血压糖尿病1刘天宇男78汉族76.52169有无2王顺义男82汉族66.721

3、75无无3苗凤兰女70其他55.10160无无4马志华男71冋族85.63182有有5■周淑宏■女■77•汉族•4&45■154■有■无•■630•赵晓曼•女■66•汉族■58.36■164■无■有原始数据中，变量一般分为标识变量和分析变量。标识变量用于数据的识别、核对和修改，是数据管理和质量控制不可或缺的变量，如上表屮的“编号”、“姓名”即为识别变量，在数据处理时不纳入分析，只用于数据的审核和修改。其余变量如“年龄”等均为分析变量。分析变量根据数据的类型可分为数值变量和分类变量两种，数值变量乂可细分为连续型变塑和非连续型（离散型）变量。数据录入的过程，应遵循方便录入、便于核查

4、、易于转换、利于分析的原则。方便录入是指在录入过程屮尽可能减少录入的工作量，将原始数据屮的分类变量或非连续型变量量化，如表1屮的性別、民族、高血压、糖尿病的患病情况等皆为分类变量，在原始数据中表现为字符的形式，可根据实际情况将其数量化，比如，对于“性别”变量，将“男性”赋值为“1”，“女性”赋值为“2”；对于糖尿病的患病情况，将“有”赋值为“1”，“无”赋值为“0”，这样既可以节省录入时间，乂将原始指标转化为可被统计分析软件识别和运算的塑化指标形式。便于核查是指一定要有标识变量，以便数据的核查校对。易于转换是指录入数据时耍考虑不同软件的要求，如一些软件不能识别中文，一些软件的变

5、量名要求不能超过8个字符等，因此，在录入数据时，变量名一般尽可能用英文，不超过8字符，数据尽可能用数值表示，这样数据库被分析软件读入时，就不易丢失数据和出现差错。利于分析是指收集的资料尽可能录成一个数据库文件，而不要分解成多个数据文件，且录入的格式应满足多种统计分析方法的需要。表2由原始数据库转化的分析数据库格式numbernamesexaagenationality1'weightheightHBPCdiabetes"1刘天宇178176.52169102王顺义182166.72175003苗凤兰270355.10160004马志华171285.63182115■周淑宏■2■

6、77■1•48.45•154■1•0■■630■赵晓曼■2■66■1■5&36■164■0■1注：a:l男、2女；b:l汉族、2回族、3其他；c:0无、、1有；d:0无、1有㈡数据的质量控制数据录入时，要注意数据的录入质量，保证录入数据的准确性和真实性。在大型数据库的录入时，建议使用专门的数据库软件如FoxPro、Access>EpiInfo、EpiData因为这些数据库软件具有较完善的数据管理、查询、修改功能，还可根据需要建立与录入表格一致的屏幕格式，便于录入，同时还可以在建立数据库时根据实际需要人为设定逻辑核查格式，便于控制数据的录入质量。在数据的计算机录入完成后，应该对数

7、据的质量进行检查，如利用数据间本身存在的逻辑关系,对数据进行逻辑核查；对原始数据的编号和数据库的数据序号进行核对，看有无缺漏；利用统计分析软件列岀变量的频数表或散点图，观察其频数分布有无异常或有无离群值的岀现；对变暈进行描述性统计，观察其样本含量、最大值、最小值是否与原始数据吻合；对分类变量或等级资料，列出交叉列联表，观察变量I'可的交互频数是否符合实际情况。㈢变量的设置将分类变量或非连续型变量量化处理后，才能被计算机识别并运算，其设置方式较为灵活，应综合考虑研究目的、资料类型、变量的分布形

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 33



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

spss实习指导

spss实习指导

相关文章

相关标签