欢迎来到天天文库
浏览记录
ID:47936593
大小:188.50 KB
页数:11页
时间:2019-11-08
《描述性大数据地分布和度量实验报告材料分析报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用文档重庆科技学院学生实验报告课程名称经济预测与决策实验项目名称描述性数据的分布和度量开课学院及实验室实验日期2015-7-3学生姓名学号专业班级指导教师实验成绩实用文档一、实验目的和要求实验目的:1、通过对学生各门课程考试成绩的统计整理,使学生掌握统计描述的一般步骤和技巧;2、掌握分布集中趋势的测度指标、离中趋势的测度指标及偏态与峰态的测度指标的计算方法和含义。实验要求:1、输出表格美观,对各描述分布特征的统计指标值的分析要合理。2、在实验报告中要写明实验的操作步骤。3、独立完成实验报告。二、实验内容和原理1、表3-1是统计学专业研究生入学考试各门课程成绩。根据表中数据按列(
2、课程)进行统计描述,求得描述各门课程数据分布的各种指标值,并分析各门课程数据分布的特征。2、按行统计每位学生的总成绩、平均成绩并进行排序,并按平均成绩进行统计描述,并分析各统计指标的含义。表3-1统计学专业研究生入学考试成绩实用文档三、主要仪器设备.实验的基本工具:电脑一台;MicrosoftEXCEL2007软件一套;四、实验操作方法和步骤操作方法:利用软件数据分析中的统计描述功能,求得描述各门课程数据分布的各种指标值,并分析各门课程数据分布的特征;在进行平均成绩、总成绩的排序以及统计指标的描述。实验步骤:在工具菜单中—选择数据分析—在数据分析中选择描述统计—选择相应的数据区域
3、—单击确定在数据菜单中—选择排序—框中所选区域—选择主关键字此关键字—单击确定实用文档五、实验记录与处理(数据、图表、计算等)按列(课程)进行统计描述按平均成绩进行统计描述实用文档统计每位学生的总成绩、平均成绩并进行排序实用文档六、实验结果及分析描述各门课程数据分布的各种指标值平均:平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。标准误差:各测量值误差的平方和的平均值的平方根,故又称为均方根误差。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。中位数:代表一个
4、样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。众数:众数是在一组数据中,出现次数最多的数据实用文档标准差:标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。方差:方差是各个数据分别与其平均数之差的平方的和的平均数,用字母D表示。在概率论和数理统计中,方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。峰度:随机变量的四阶中心矩与方差平方的比值又称峰态系数。表征概率密度分
5、布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了尾部的厚度。偏度:概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。定义上偏度是样本的三阶标准化矩,定义式如下[1] ,其中分别表示二阶和三阶中心距:最大最小值:一组数据中数值最大的值和数值最小的值。分析各门课程数据分布的特征统计数据的分布特征可以从三方面来描述:实用文档一是数据分布的集中趋势,反映各项数据向中心值靠拢或聚集的程度,如算术平均数,位置平均数。从统计描述分析中,可以看出四科的平均成绩,政治的平均分为66.76,英语平均分为58.16,数学平均分为56.5,统计学平均分为75.
6、88;四科的众数分别为,政治72,英语66,数学54,统计85;四科的中位数为,政治69.5,英语58,数学57,统计77.5从各科的平均值可以看出,数学的平均分、众数、中位数最差,统计学的平均数、众数、中位数最高。数学的离中趋势最差,统计学的离中趋势很好。这些反映了50名同学的一般水平,统计学成绩较好,其次是政治成绩,英语成绩一般,最偏科普遍成绩不太理想的是数学成绩。二是数据分布的的离中趋势,反映各数据远离其中心值的程度,如标准差、方差,从表中我们可以看出政治的标准差为8.433839,英语是标准差为8.028972,数学的标准差为18.55081,统计学的标准差为12.954
7、6。离散程度最小的是英语,离散程度最大的是数学。离散程度越大,代表程度就越差。说明数学的成绩的代表性最差,英语成绩的代表性较好。三是峰度和偏度,反映数据分布的形状。从结果可以看出各科偏度系数小于0,说明各科成绩呈负分布,即较高分的人比较多。峰度系数有三科小于0,说明该科成绩分布为低峰曲线。统计学峰度为0.4266大于零,分步曲线为高峰曲线,说明变量值的差异程度小,平均数的代表性好。平均成绩进行统计描述,并分析各统计指标的含义。按平均成绩进行统计描述后,平均成绩为64.325,中位
此文档下载收益归作者所有