欢迎来到天天文库
浏览记录
ID:38507735
大小:365.50 KB
页数:20页
时间:2019-06-13
《数据的数字特征》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§4数据的数字特征Data’scharacteristic复习回顾利用统计图表可以显示样本数据的特征统计图条形统计图折线统计图扇形统计图茎叶图数据的特征除了利用统计图表外,还可以利用一些统计量(多个数据“加工”为一个数值)来表述,使这个数值能反映这组数据的某些重要的整体特征。前面我们在表示数据的集中趋势和离散程度时,我们利用平均数、中位数,众数、极差、方差等来表示。就是一组数据的平均,设有n个数据,x1,x2,…,xn,这组数据的平均数为:特别地,如果上面n个数据中不同数据x1,x2,…,xn的个数分别为k1,k2,…,kn,那么
2、它们的平均数为常用的特征数一、复习:1、平均数:就是一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数(或中间两数的平均数)称为这组数据的中位数.奇数个数时,中间那1个偶数个数时,中间那两个的平均数就是一组数据中出现次数最多的数.2、中位数:3、众数:平均数、中位数或众数反映数据的集中趋势就是一组数据中最大数与最小数之间的差.就是一组数据中所有数与平均数的差的平方和的平均数.设有n个数据x1,x2,…,xn,这组数据的方差为:4、极差:5、方差:极差和方差反映数据的离散程度月工资/元80005000400020001
3、000800700600500员工数/人12461282052(1)分别计算该公司员工月工资的平均数、中位数和众数。(2)公司经理会选取上面哪个来代表该公司员工的月工资情况,税务官呢?工会领导呢?分析:1.根据平均数、中位数的计算公式,可以算出平均数为:1373元,中位数为:800元,众数为:700元2.不同身份的人代表不同阶层人的利益,对公司领导平均数好,对税务官中位数比较好,对工会领导众数即使他的选择例1某公司员工的月工资情况如表:如果你应聘该公司,你怎样看待公司员工的收入情况?平均数是将所有的数据都考虑进去得到的度量,它是反
4、映数据集中趋势最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用例2、在上一节中,从甲乙两个城市随机抽取的16台自动售货机的销售额可以用茎叶图表示如下86588400752003180123450280233712448238甲乙1°甲乙两组数据的中位数众数极差分别是多少?2°你能从上图中分别比较甲乙两组数据的平均数和方差的大小吗?甲的中位数:20众数:101830极差:53乙的中位数:29众
5、数:2334极差:38甲的平均数:22.8方差:210.9乙的平均数:28.6方差:115.2例3、甲乙两台机床同时生产直径为40mm的零件,为了检验产品的质量,从两台机床生产的产品中个抽取10件进行测量,结果如下:甲/mm40.039.840.140.239.940.040.239.840.239.8乙/mm40.040.039.940.039.940.140.140.140.039.9你能选择适当的数分别表示这两组数据吗?方法1(极差)甲:40.2-39.8=0.4乙:40.1-39.9=0.2方法2(方差)甲:=0.026(
6、m㎡)乙=0.006(m㎡)它们的平均数都是40,因此仅用平均水平还难以准确地刻画一组数据方法3甲乙方法4甲乙用不同的方式刻画数据离散程度,其理想的形式满足一下三条:1°应充分利用数据,以便提供更确却的信息2°仅用一个数据来刻画数据的离散程度3°对于不同的数据,当离散程度大时,该数亦大问题这么多方式都可以表达,那么什么方式表达最好呢?方法1(即极差)因为极差对极值过于敏感,显然不满足第一条原则。方法4、满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。但运算量大。方法2(即方差)满足理想形式的三条原则,它是刻画数据离散程度
7、的一种方法,但是它的单位是原观测数据的单位的平方。所以在实际中,人们更多使用的是标准差方法3(即绝对差)满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。二、标准差1、方差的正的平方根2、公式:3、优点:(1)、从数学上来说,二次函数的性质比绝对值函数要好;(2)、单位一致;(3)、比较方便运算。问题3分别计算上题中的甲乙车床的标准差?根据标准差计算公式甲:s=0.16(mm)乙:s=0.077(mm)因为甲的标准差比乙大,因此乙更稳定注意:对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不
8、是记忆和使用的熟练程度.因此,在分析数据的过程中,要理解数据的平均值和标准差在此处的意义,再对估计结果作出客观的评判小结:1.众数、中位数、平均数的概念2.三种数字特征的优缺点3.极差、方差、标准差的概念4.如何利用标准差刻画数据的离散程度?1、练
此文档下载收益归作者所有