描述统计学数值方法ppt课件.ppt

描述统计学数值方法ppt课件.ppt

ID:59440910

大小:1.08 MB

页数:41页

时间:2020-09-18

描述统计学数值方法ppt课件.ppt_第1页
描述统计学数值方法ppt课件.ppt_第2页
描述统计学数值方法ppt课件.ppt_第3页
描述统计学数值方法ppt课件.ppt_第4页
描述统计学数值方法ppt课件.ppt_第5页
资源描述:

《描述统计学数值方法ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、3描述统计学Ⅱ:数值方法位置的度量变异程度的度量相对位置的度量和异常值检测探索性数据分析两变量间关系的度量加权平均数和使用分组数据1平均数平均数(Mean):衡量数据集中心位置的量度。用所有数据值相加的和除以项数计算。如果数据来自某个样本,则其平均数以表示;如果数据来自某个总体,则其平均数以希腊字母μ表示。样本平均数总体平均数2平均数总体参数:用来概括总体数据的量度的数值。样本统计量:用来概括样本数据的量度的数值。3中位数中位数(Median):衡量数据集中心位置的量度。中位数的值将所有的数据分为两个相等部分,一部分的值都大于或等于它,而另一部分的值都小于

2、或等于它。奇数项:中位数是以递增顺序排列的所有数据项的正中央的那一项的数值。偶数项:中位数就以递增顺序排列的所有数据项的正中央的两项的平均值。4中位数衡量数据中心位置时,平均数的应用要更加普遍。但在某些情况下,平均数往往会受到极端大的或极端小的数值的影响。例:在年收入及财产数据中,因为收入和财产中的少数极端值将会夸大平均数。在这种情况下,中位数成为更好的衡量中心位置的量度。5例:12名商学院毕业生的起始月薪数据样本GraduateStartingSalary12850229503305042880527556271072890831309294010332

3、5112920122880平均数:$2940中位数:$290510000平均数:$3496中位数:$29056众数众数(Mode):用以衡量数据的位置的量度,定义为发生频数最高的数据值。有时发生频数最大的数据值可能会有两个或更多。如果在数据中恰有两个众数,我们称此数据是双众数的。如果在数据中有多于两个以上的众数,我们则称此数据是多众数的。在多众数的情况下,众数几乎从不被列报。因为列出3个或更多的众数,对于描述数据的位置并不能起多大作用。众数是衡量品质数据位置的重要量度7百分位数百分位数(Percentile):至少有p%的数据项小于等于这个值,且至少有(1

4、00-p)%的数据项大于等于这个值。第50百分位数即为中位数。8百分位数计算第p百分位数第1步:以递增顺序排列原数据(即从小到大排列)第2步:计算指数i第3步:(1)若i不是整数,将i向上取整。大于i的毗邻整数指示第p百分位数的位置。(2)若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均值。9例:12名商学院毕业生的起始月薪数据,计算第85百分位数第1步:将12个数据以递增顺序排列。第2步:第3步:由于i不是整数,将其向上取整,则第85百分位数的位置是第11项。计算第50百分位数?Graduate651412711923810StartingS

5、alary27102755285028802880289029202940295030503130332510四分位数人们经常会将数据集划分为4个部分,每一个部分大约包含有1/4即25%的数据项。这种划分的临界点即为四分位数(Quartiles):Q1=第1四分位数,即第25百分位数Q2=第2四分位数,即第50百分位数Q3=第3四分位数,即第75百分位数Graduate651412711923810StartingSalary271027552850288028802890292029402950305031303325113描述统计学Ⅱ:数值方法位置的度

6、量变异程度的度量相对位置的度量和异常值检测探索性数据分析两变量间关系的度量加权平均数和使用分组数据12变异程度的度量一个大型加工工厂定期向两个不同的供应商订货,两个供应商都指出订货后大约10天才能交货。二者交货所需工作日的数据直方图如下图所示。二者是否在按时供货的可靠性上是一致的?你更愿意向哪一个供货商订货呢?13级差级差(Range):用以衡量变异程度的量度,定义为最大值减最小值的差,也称为全距。是衡量数据集变异程度的最简单的量度。但它却极少被单独使用,原因是级差仅仅是基于两个数据项的,因此极大地为极端数值所影响。Graduate651412711923

7、810StartingSalary27102755285028802880289029202940295030503130332514四分位点内距四分位点内距(IQR):用以衡量变异程度的量度,定义为第3四分位数与第1四分位数之差。也就是说,四分位点内距是在中间的50%的数据的级差。对于上述的起薪数据,四分位数Q1=2865,Q3=3000。因此,四分位点内距为135。Graduate651412711923810StartingSalary27102755285028802880289029202940295030503130332515方差方差(Var

8、iance):用以衡量所有数据变异程度的量度,是建立在各数据值与平

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。