资源描述:
《SPSS实验报告》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
湖北汽车工业学院SPSS实验报告姓名:潘勇专业:工商管理(汽车营销)班级:T1053-1学号:20100530104
1目录一、SPSS的数据管理,,,,,,,,,,,,,,,,01二、描述性统计分析,,,,,,,,,,,,,,,,04三、均值检验,,,,,,,,,,,,,,,,,,,07四、相关分析,,,,,,,,,,,,,,,,,,,09五、因子分析,,,,,,,,,,,,,,,,,,,11六、聚类分析,,,,,,,,,,,,,,,,,,,17七、回归分析,,,,,,,,,,,,,,,,,,,21八、实验总结,,,,,,,,,,,,,,,,,,,23
2实验一——SPSS的数据管理一、实验目的:熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;掌握SPSS的数据管理功能二、实验内容:高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav.该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低录取分数线:400分。(2)个人档案中若有“不良记录”,不予录取。(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西部考生加10分。(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。三、实验过程:1)打开数据表“compute.Sav”选“数据”菜单的“选择个案”命令项,弹出对话框。选择“如果条件满足”单选按纽,点击“如果”钮,弹出对话框,输入条件:数学+语文+英语+综合>=400and不良记录=0单击“继续”按纽。在“输出”栏选择“删除未选定个案”项,淘汰掉总分小于400,有不良-1-
3记录的学生2)选“转换”菜单的“计算变量”项在弹出的对话框中,首先在“目标变量”指定一个变量综合分然后点击“类型与标签”钮确定是数值型变量,还是字符型变量,或加上变量标签。在“数字表达式”框中键入运算公式:数学+语文+英语+综合+奖项*10单击“确定”按纽。3)再次选“转换”菜单的“计算变量”命项在弹出的对话框中,在“数字表达式”框中键入运算公式:综合分+20然后单击“如果”按纽选择“如果个案满足条件则包括”单选按纽,输入条件:民族<>1,单击“继续”按纽,再单击“确定”按纽。4)再次选“转换”菜单的“计算变量”命项在弹出的对话框中,在“数字表达式”框中键入运算公式:综合分+10然后单击“如果”按纽选择“如果个案满足条件则包括”单选按纽,输入条件:省份=1,单击“继续”按纽,再单击“确定”按纽5)选择“数据→排序个案”命令,弹出对话框,把“综合分”-2-
4变量选入“排序依据”中,并在“排列顺序”中选择“降序”选项,将学生成绩按降序排列,单击“确定”按钮。四、结果分析:最后被录取的七名学生是:艾甫尔513.00孙悦婷495.00张国欣471.00郭东洋462.00杨乐451.00高超438.00易仲勃434.00-3-
5实验二——描述性统计分析一、实验目的:利用SPSS进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。二、实验内容:打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。三、实验过程:1)打开数据文件descriptives.sav,选“数据”菜单的“选择个案”命令项,弹出对话框。选择“如果条件满足”单选按纽,点击“如果”钮,弹出对话框,输入条件:班级=1单击“继续”按纽。在“输出”栏选择“过滤掉未选定的个案”项,单击“确定”按钮。
62)在主菜单栏单击“分析”,在出现的下拉菜单里移动鼠标至“描述性统计”项上,在出现的次菜单里单击“描述性”项,打开对话框。从左则的源变量框里选择年龄、体重、身高三个变量进入“变量”框里。单击“选项”钮,弹出“选项”对话框,选中均值Std.deviation标准差最小值方差最大值范围复选框,单击“继续”按钮,单击“确定”按钮。3)2、3班操作类似,只需将条件改为“班级=2”、“班级=3”即可四、结果分析:结果显示如下班级1班级2班级3-5-
71班年龄的最大值,最小值,平均数最小,方差和标准差最大;体重的极差,最大值,最小值,平均数,方差,标准差都最小;身高的极差,最大值,最小值,平均数,方差,标准差都最小。2班年龄的最大值,最小值,平均数居中,方差和标准差最小;体重的极差,最大值,最小值,平均数,方差,标准差都居中;身高的极差,最大值,最小值,平均数,方差,标准差都居中。3班年龄的最大值,最小值,平均数最大,方差和标准差居中;体重的极差,最大值,最小值,平均数,方差,标准差都最大;身高的极差,最大值,最小值,平均数,方差,标准差都最大。-6-
8实验三——均值检验一、实验目的:学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。二、实验内容:一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。三、实验过程:1)打开数据文件ttest1.sav,1选择菜单“分析→比较均值→单样本T检验”。弹出“单样本T检验”对话框。2)在对话框左侧的变量列表中选择变量“制动闸直径”进入“检验变量”框;在“检验值”编辑框中输入过去的平均制动闸直径值322,单击“选项”按钮,选择90%的置信水平。单击“确定”按钮。四、结果分析:结果显示如下-7-
9由于计算统计量=1.055〉检验统计量=0.295,所以拒绝原假设,即有显著差异-8-
10实验四——相关分析一、实验目的:学习利用SPSS进行相关分析、偏相关分析、距离分析。二、实验内容:打开数据文件correlate1.sav,要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。三、实验过程:1)打开数据文件correlate1.sav,.选择菜单“分析→相关→双变量”,弹出“双变量相关”对话框。在对话框左侧的变量列表中选汽车价格、汽车的燃油效率,使之进入“变量”框;再在“相关系数”框中选择Pearson相关系数(r);在“显著性检验”框中选相关系数的“双侧检验”。选中复选框“标记显著性相关”设置是否突出显示显著相关。-9-
112)单击“选项”按钮,弹出“双变量相关性:选项”对话框,选择“均值和标准差”和“叉积偏差和协方差”项,输出X、Y的均数与标准差以及XY交叉乘积的标准差与协方差。单击“确定”按钮。三、结果分析:结果显示如下:由于两变量之间的相关系数为-0.492,故两变量之间是低度负相关。即燃油消耗率越低,汽车价格越高。-10-
12实验五——因子分析一、实验目的:运用因子分析方法分析数据二、实验内容:下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。X1X2X3X4X5X6X73.763.660.545.289.7713.744.788.594.991.3410.027.5010.162.136.226.144.529.842.172.731.097.577.287.0712.661.792.100.829.037.082.5911.764.546.221.285.513.981.306.925.337.302.403.270.620.443.367.638.848.398.747.003.3111.683.534.761.129.649.491.0313.5713.1318.522.359.731.331.009.879.8711.063.708.592.981.179.177.859.912.627.125.493.689.722.643.431.194.693.012.175.982.763.552.015.511.341.275.814.575.383.431.661.611.572.801.782.093.725.905.761.558.845.407.501.979.849.271.5113.609.0212.671.758.394.922.5410.053.965.241.434.944.381.036.686.499.062.817.232.301.777.794.395.372.279.467.311.0412.0011.5816.182.429.555.354.2511.742.773.511.054.944.524.508.071.792.101.298.213.082.429.103.754.661.729.416.445.1112.502.453.100.91三、实验过程:1)输入数据→激活“分析”菜单选“降维”的“因子分析”命令项,弹出对话框(图5-1)。在对话框左侧的变量列表中选变量X1至X7,点击钮使之进入变量框。-11-
13图5-12)点击“描述”钮,弹出“描述统计”对话框(图11.3),在对话框选“单变量描述性”项要求输出各变量的均数与标准差,在相关系数栏内选“系数”项要求计算相关系数矩阵,并选KMO和Bartllet的球形度检验项,要求对相关系数矩阵进行统计学检验。点击“继续”钮返回“因子分析”对话框。图5-2-12-
143)点击“抽取,”钮,弹出“因子分析:抽取”对话框(图5-3),选用“主成份”方法,并勾选“碎石图”和“未旋转因子解”选项,之后点击“继续”钮返回之前对话框。图5-34)点击“旋转”钮,弹出“旋转”对话框(图5-4),图5-4-13-
15本例选“最大方差法”,以帮助我们解释因子,勾选“载荷图”之后点击“继续”钮返回“因子分析”对话框。5)点击“得分...”钮,弹出弹出“因子分析:得分”对话框,选“回归因子得分”,之后点击“继续”钮返回之前对话框,再点击“确定”钮即完成分析。(图5-6)图5-5三、结果解释:1)在输出结果窗口中将看到如下统计数据:图5-6系统首先输出各变量的均数与标准差,并显示共有25例观察单位进入分析;接着输出相关系数矩阵,经Bartlett检验表明:Bartlett-14-
16值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。Kaiser-Meyer-OlkinMeasureofSamplingAdequacy图5-7是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。今KMO值=0.32122,偏小,意味着因子分析的结果可能不能接受。图5-82)使用主成分分析法得到2个因子,因子矩阵如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X7与第一因子的值为-0.88644,与第二因子的值为0.21921,可见其与第一因子更近,与第二因子更远。或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。-15-
17图5-9下面显示经正交旋转后的因子负荷矩阵和因子转换矩阵。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。-16-
18实验六——聚类分析一、实验目的:运用聚类分析方法分析数据二、实验内容:29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。编号钙镁铁锰铜血红蛋白N0.X1X2X3X4X5X6154.8930.86448.700.0121.01013.50272.4942.61467.300.0081.64013.00353.8152.86425.610.0041.22013.75464.7439.18469.800.0051.22014.00558.8037.67456.550.0121.01014.25643.6726.18395.780.0010.59412.75754.8930.86448.700.0121.01012.50886.1243.79440.130.0171.77012.25960.3538.20394.400.0011.14012.001054.0434.23405.600.0081.30011.751161.2337.35446.000.0221.38011.501260.1733.67383.200.0010.91411.251369.6940.01416.700.0121.35011.001472.2840.12430.800.0001.20010.751555.1333.02445.800.0120.91810.501670.0836.81409.800.0121.19010.251763.0535.07384.100.0000.85310.001848.7530.53342.900.0180.9249.751952.2827.14326.290.0040.8179.502052.2136.18388.540.0241.0209.252149.7125.43331.100.0120.8979.002261.0229.27258.940.0161.1908.752353.6828.79292.800.0481.3208.502450.2229.17292.600.0061.0408.252565.3429.99312.800.0061.0308.002656.3929.29283.000.0161.3507.802766.1231.93344.200.0000.6897.502873.8932.94312.500.0641.1507.252947.3128.55294.700.0050.8387.00-17-
19三、实验内容:1.建立数据文件。定义变量名:钙、镁、铁、锰、铜和血红蛋白的变量名分别为x1、x2、x3、x4、x5、x6,之后输入原始数据。2.选择菜单“分析→分类→系统聚类”,弹出聚类分析对话框。从对话框左侧的变量列表中选x1、x2、x3、x4、x5、x6,使之进入变量框;在“分群”处选择聚类类型(对变量聚类),如下图。3.单击“统计”按钮,弹出“聚类分析:统计量”对话框,选择“相似性矩阵”以显示距离矩阵。4.单击“绘制”按钮,弹出“聚类分析:图”对话框,选择“树状图”项。5.单击“方法”按钮,弹出“聚类分析:方法”对话框,选择“组间连接”和“皮尔森相关性”。6.单击“确定”按钮,得到输出结果。-18-
20四、结果分析:在结果输出窗口中将看到如下统计数据:共29例样本进入聚类分析,采用相关系数测量技术。先显示各变量间的相关系数,这对于后面选择典型变量是十分有用的。然后显示类间平均链锁法的合并进程,即第一步,X3与X6被合并,它们之间的相关系数最大,为0.863431;第二步,X1与X5合并,其间相关系数为0.624839;第三步,X2与第一步的合并项被合并,它们之间的相关系数为0.602099;第四步,它们与第二步的合并项再合并,其间相关系数为0.338335;第五步,与最后一个变量X4合并,这个相关系数最小,为-0.054485。按类间平均链锁法,变量合并过程的冰柱图如下。先是X3与X6-19-
21合并,接着X1与X5合并,然后X3、X6与X2合并,接着再与X1、X5合并,最后加上X4,六个变量全部合并。下面用更为直观的聚类树状关系图表示,即X1、X2、X3、X5、X6先聚合后与X4再聚合。这表明,在评价儿童营养状态时,可在微量元素钙、镁、铁、铜和血红蛋白5个指标中选择一个,再加上微量元素锰即可,其效果与六个指标都用是基本等价的,但更经济更迅速。-20-
22实验七——回归分析一、实验目的:运用一元线性回归与多元线性回归进行预测二、实验内容:某医师测得10名3岁儿童的身高(cm)、体重(kg)2和体表面积(cm)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(Y)身高(X1)体重(X2)15.38288.011.025.29987.611.835.35888.512.045.29289.012.355.60287.713.166.01489.513.775.83088.814.486.10290.414.996.07590.615.2106.41191.216.0三、实验过程:激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,保留1位小数。输入原始数据。点击“统计”菜单选“回归”中的“线性”项,弹出“线性回归”对话框。从对话框左侧的变量列表中选y,点击钮使之进入“因变量”框,选x1、x2,点击钮使之进入“自变量”框;在“方法”处下拉菜单,选用“进入”法。点击“确定”钮即完成分析。三、结果分析:在结果输出窗口中将看到如下统计数据:-21-
23标准化Y预测值作变量分布图结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为Y=0.0687101X1+0.183756X2-2.856476。-22-
24实验总结通过本次为期只有一周的实习,我初步了解了SPSS软件的操作,和一些简单的应用,在实验指导书和老师的指导下,完成了本次实验的全部内容,但是还有很多不是很懂的地方,在操作时候,遇到很多困难,首先实验开始的时候软件是英文的,打开软件不知道各种单词的意思,后来有了中文版这个问题便得到了解决。在做实验的时候,建表和数据输入以及一些常用的分析方法,开始的时候不看指导书总是找不到对应的位置,但是随着实验的深入慢慢地记住了一些常用的统计方式的对应位置,为数据分析的效率提升了很大一步。《统计学》的课程实习结束了,但是,统计方法依然只是起步,还有很多要学习和掌握的地方,SPSS确实是一款很强大的软件,细致准确,对企业根据已有的数据做出对未来形式的判断以及做出准确的决策有很大的帮助,值得我们更加深入地去学习它。-23-