欢迎来到天天文库
浏览记录
ID:59765685
大小:34.44 KB
页数:10页
时间:2020-11-23
《数据分析实验报告.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数据分析实验报告【最新资料,WORD文档,可编辑修改】第一次试验报告习题1.31建立数据集,定义变量并输入数据并保存。2数据的描述,包括求均值、方差、中位数等统计量。分析—描述统计—频率,选择如下:输出:统计量全国居民农村居民城镇居民N有效222222缺失000均值1116.82747.862336.41中值727.50530.501499.50方差1031026.918399673.8384536136.444百分位数25304.25239.75596.2550727.50530.501499.50751893.501197.004136.751画直方图,茎叶图,QQ图。(
2、全国居民)分析—描述统计—探索,选择如下:输出:全国居民Stem-and-LeafPlotFrequencyStem&Leaf9.000.1222233445.000.567882.001.031.001.71.002.33.002.6891.003.1Stemwidth:1000Eachleaf:1case(s)分析—描述统计—QQ图,选择如下:输出:习题1.11数据正态性的检验:K—S检验,W检验数据:取显着性水平为0.05分析—描述统计—探索,选择如下:(1)K—S检验单样本Kolmogorov-Smirnov检验身高N60正态参数a,,b均值139.00标准差7.06
3、4最极端差别绝对值.089正.045负-.089Kolmogorov-SmirnovZ.686渐近显着性(双侧).735a.检验分布为正态分布。b.根据数据计算得到。结果:p=0.735大于0.05接受原假设,即数据来自正太总体。(2)W检验正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.身高.08960.200*.97260.174a.Lilliefors显着水平修正*.这是真实显着水平的下限。结果:在Shapiro-Wilk检验结果w00.972,p=0.174大于0.05接受原假设,即数据来自正太总体。习题1.
4、51多维正态数据的统计量数据:统计量x1x2x3x4N有效21212121缺失0000均值18.21927.8674.50533.767均值向量为:X(18.219,27.836,4.505,33.767)项间协方差矩阵x1x2x3x4x13.5092.7071.0191.266x22.7073.5591.1391.289x31.0191.1391.9981.740x41.2661.2891.7404.032相关性x1x2x3x4x1Pearson相关性1.766**.385.336显着性(双侧).000.085.136N21212121x2Pearson相关性.766**1
5、.427.340显着性(双侧).000.054.131N21212121x3Pearson相关性.385.4271.613**显着性(双侧).085.054.003N21212121x4Pearson相关性.336.340.613**1显着性(双侧).136.131.003N21212121**.在.01水平(双侧)上显着相关。结果:x4与其他数据无相关性,其他三组数据线性相关相关系数x1x2x3x4Spearman的rhox1相关系数1.000.790**.434*.431Sig.(双侧)..000.049.051N21212121x2相关系数.790**1.000.51
6、1*.488*Sig.(双侧).000..018.025N21212121x3相关系数.434*.511*1.000.691**Sig.(双侧).049.018..001N21212121x4相关系数.431.488*.691**1.000Sig.(双侧).051.025.001.N21212121**.在置信度(双测)为0.01时,相关性是显着的。*.在置信度(双测)为0.05时,相关性是显着的。结果:由Spearman相关矩阵的输出结果看,取显着性水平0.1,p值皆小于0.1,所以数据相关性显着习题2.41线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐
7、步回归。2残差分析分析—回归—线性,选择如下:输出:逐步回归结果:两变量的系数p值均小于0.05均有统计学意义。结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。概率论课本习题7.51一个正态总体独立样本均值的t检验与区间估计分析—比较均值—独立样本T检验:输出:One-SampleStatisticsStd.ErrorNMeanStd.DeviationMean折断力102833.5035.04411.082结果:样本均值为2833.50与总体均值2820比较接近One-Sample
此文档下载收益归作者所有