欢迎来到天天文库
浏览记录
ID:45560531
大小:1.25 MB
页数:79页
时间:2019-11-14
《《管理统计学》马庆国著》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章样本数据特征的初步分析一、整理样本数据信息在被操纵或处理后并没有超出其原有的格式原始数据--两种整理原始数据的基本方法数据阵列频数分布2、整理数据--数据阵列保留了数据的原值,并按数值的升序或降序显示数据。易观察到:数据集中包含最大观察值和最小观察值确认在某个数据集中哪些数组具有相同的值很容易发现各个值之间的差异3、样本数据结构的基本特征:频次与频率一、一些基本概念1、频次(频数)在有限的样本数据集合中,同样的数据值(样本值)出现的次数称为该样本值出现的频次。2、频率该样本值出现的频次/该数据集合的数据总数。常用表示方法:(1)表;(2)饼图;(3)条形图;二、样本数据
2、集合的基本特征的延伸:累积频率当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据xi的频率值累加起来,就得到“小于等于xi”的累积频率。注:名义级的样本数据集合,不存在累积频率问题。表示法同上。整理数据--频数分布将数据值分成几组显示各组中有多少数值很容易发现数据的图形特点无法保留原始数据的值频数分布定义某个变量所有可能值的集合显示了变量的图形特点分布当数据集为小型时,数据之间的变化特点很容易观察出来随着数据集变为中型或大型,变量的特性一般表现得越来越不明显定义频数分布的类别频数分布频数每一组包含的观察值数目组组限每一组的上限和下限组宽上限和下限之间的间距如
3、何将数据转换成表格?哪些重要或必要的信息应当包括在内?确定“组数”和“组宽”频数分布一般包括与每组有关的频数、累积频数、相对频数和相对累积频数频数分布频数分布累积频数相对频数相对累积频数显示每组范围内或其下有多少观察值相对频数描述每组范围内观察值所占的百分比,即每组的频数除以观察值的总数目显示每组范围内或其下观察值所占的百分比对于定性变量而言--常常根据变量结果的种类来选择组例如,为了研究本班100名学生的性别--频数分布对于定量变量而言--选择“组数”和“组宽”是主要问题频数分布应当遵循哪些基本原则来确定组--1.各个组之间必须是“相互排斥”的2.各个组必须将“所有数据均
4、包括在内”3.组数K的经验法则2Kn,此处n代表观察值的总数目4.各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时,W频数分布5.应当尽量避免开口组6.组宽最好是整数例如,为了研究某班100名学生的身高--我们确定将整个数据分成5组,每组宽度相等,W=10厘米频数分布1.一张整理有序的表格可以使数据中隐藏的信息清楚地表现出来2.有助于采用图形方式来汇总数据数据集表格不具有唯一性频数分布频数分布以下数据表示一个当地咖啡馆进行的30笔交易举例146415347524816719254857696241463527726448517764515026428338频数分布首先
5、--确定“组数”和“组宽”样本大小n=3025=32>305组最小观察值=14,最大观察值=83最好采用“整数”W=15组数组宽频数分布茎叶图形数据必须按照升序排列为了构造图形,我们将数值的第一个数字作为茎茎叶排列使我们可以通过图形来了解数据的分布茎叶图形例如,我们想将12个数据转换成一张茎叶图形:4.43.64.43.77.63.93.63.53.04.53.82.22
6、23
7、05667894
8、4455
9、6
10、7
11、6茎叶图形用直观方式显示定量变量三种最常使用的图形类型--直方图频数多边形分布曲线在构造图形之前,需要用频数分布来显示数据用直观方式显示定量变量
12、--直方图应当将数据转换成频数分布表水平轴代表变量的数值,核对符号代表每一组的中点垂直轴代表计数频数或百分比频数每个条形图的高度与每一组的频数或百分比相对应每个条形图的宽度与每一组的宽度相对应用直观方式显示定量变量--直方图例如,我们在本单元中想通过绘制直方图来表示100名学生的身高分布身高185.0175.0165.0155.0145.0计数频数403020100用直观方式显示定量变量--频数多边形身高190.0180.0170.0160.0150.0计数频数403020100200.0140.0用线段将各组中点和频数(或相对频数)的交叉点连接起来,就可以得到频数多边形
13、图形身高.190.0180.0170.0160.0150.0累积计数频数806040200140.0100用直观方式显示定量--分布曲线图形显示了每一组的累积频数或相对累积频数它可以用“小于”或“大于”来表示定性变量常常用非数值刻度来测量对这些变量可以进行分类可以采用两种最为常见的图形来描述定性变量的分布饼图条形图用直观方式显示定性变量饼图的圆圈代表了所有观察值的集合根据定性变量的类型数目将饼图分成几个部分饼图每一部分的大小与每一类型的相对频数成正比用
此文档下载收益归作者所有