欢迎来到天天文库
浏览记录
ID:51646261
大小:771.00 KB
页数:63页
时间:2020-03-27
《《数据获取、处理》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二讲数据获取与处理1.怎样获取数据2.频数分布3.集中量数4.差异量数样本并非总是与总体一致。这样我们就需要研究如何抽取样本?什么样的样本较为合适?同时,还要考虑如何有效的处理和分析数据,如何设计最佳试验方案以减少导致错误结论的风险。应用数学理论计算出出现这种风险可能性的大小,描述这种可能性大小的数量指标称为概率。运用概率论来研究统计学的学科称为数理统计。1.怎样获取数据描述性统计单纯对一组数据的面貌特征进行分析研究推断性统计选取样本,通过对样本的描述来推断整体的特性统计方法我们把搜集记录下来的数量依据称为数据从总体中抽出部分样本展开调查来获取数据,统计学上称此为抽样调查。所考虑对象的全体
2、统计学上称为总体或母体,其中每一个对象称为个体,而从总体中抽取的一部分个体称为样本或子样,样本中所含个体的数目称为样本容量,通常用字母n表示。(样本分为大样本(n≥30)与小样本(n<30),样本容量的选取取决于实验的条件和精度,样本越大,反映总体的信息越充足,但计算量也越大,故样本容量最好适当。)能充分反映总体的信息每个个体被抽到的可能性相同,个体与个体之间互不影响,数学上称为个体互相独立每个个体具有和总体相同的本质特性样本具有某种代表性,数学上称此为与总体同分布。抽样调查要求样本具有的两个特征满足以上两条的样本称为随机样本;从总体中抽出一个随机样本,称为随机抽样抽样调查随机抽样分层抽样等
3、距抽样随机数表法抽签法有放回抽样无放回抽样简单随机抽样1、随机数表法随机数表是根据数理统计的原理,由许多随机数字排列起来的数字表,表中数字的构造方法是:利用计算机使0,1,…,9十个数字号码中每次自动出现一个号码,用这种方式得到一串数,编排成组(一般四个数为一组)2、抽签法抽签法是将所有个体编号打乱次序用类似于抽签的方法从中来获取随机样本←分层抽样是按一定标志把总体内的每个个体划分为若干层,使相互差异小的个体集中在一层内,从而可以缩小各层内个体之间的差异程度,使样本中各个个体在总体中散布更均匀。分层抽样时,从各层抽取的样本个数可以与各层个体数成比例。具体做法是:把总体中个个体划分为个不相重叠
4、的部分,使每一部分包含的个体数分别为,且,则第层所含的样本个体数为(1.1.1),其中为样本容量,为第层的层权数。例如,要从某校210名7至9岁儿童中抽出三分之一进行智力测验。已知该校7岁儿童有63人,8岁儿童有112人,9岁儿童有35人,现在用分层抽样法确定各年龄组儿童入数。由(1.1.1)式得(7岁组)=(210/3)×(63/210)=21(人),(8岁组)=(210/3)×(112/210)=37(人),(9岁组)=(210/3)×(35/210)=12(人)。等距抽样法:把所有个体按顺序排列起来,然后以确定的相等距离抽取随机样本有放回抽样从总体中抽出一个个体记下其特征后再放回总体,
5、然后进行第二次抽样无放回抽样从总体中抽出一个个体后不再放回去,再抽第二次抽样当总体内个体数目较多时,这两种抽样方式没有本质区别。教育统计中一般采用无放回抽样,但由于有放回抽样能简化某些计算,故当总体内个体数目较多时,我们可以看做是有放回抽样。通过抽样获取数据离不开求实的科学态度和认真的工作作风,数据如果不准确、不完整、或有遗漏,不仅数据本身失去价值,而且以此进行分析推断还会导致错误的结论。2.频数数据的基本类型离散型数据取整数值的数量指标,是计数性的,数据之间不能再划分为更小的单位连续型数据经过度量和测定而得到的数量指标。这类数据取值可以连续变化,尽管数据本身仍然是数轴上的点,但数据与数据之
6、间可以无限细分,也就是数据的取值范围可以充满一个区间频数分布表示方法频数分布表离散型数据的频数分布表连续型数据的频数分布表累积频数分布表频数分布图累积频数分布曲线图一、频数分布表一组数据中每个数据出现的次数称为这个数据的频数。按频数分类列出的一览表称为频数分布表。1、离散型数据的频数分布表例1某幼儿园测定5岁组儿童智力,共7个项目。全园30名5岁儿童中有1人答对1项、3人答对2项、4人答对3项、8人答对4项、7人答对5项、5人答对6项、2人答对7项。我们列出频数分布表如下:答对题数频数答对题数频数11572365347248总和30表1.130名儿童智力测定分布2、连续型数据的频数分布表例2
7、附中初二年级实验班40名同学期末数学统考测验得分如下:68.079.080.083.062.059.080.081.061.583.067.097.063.593.076.097.584.564.075.088.091.078.567.094.081.070.086.572.085.094.078.091.060.075.582.091.095.052.076.580.0这一组数据中最大值是97.5,最小值是
此文档下载收益归作者所有