欢迎来到天天文库
浏览记录
ID:48814629
大小:314.50 KB
页数:26页
时间:2020-01-28
《样本与统计量.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数理统计华南农业大学理学院应用数学系StatisticsAppliedMathematicDepartment,CollegeofSciences,SCAU第五章样本与统计量引言随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。引言例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从什么分布是未
2、知的;产品是否合格服从两点分布,但参数——合格率p是未知的;数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。从第五章开始,我们学习数理统计的基础知识。数理统计的任务是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性作出合理的推断.数理统计所包含的内容十分丰富,本书介绍其中的参数估计、假设检验、方差分析、回归分析等内容.第五章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基础。学习的基本内容样本与统计量总体与样本在数理统计中,把研究对象的全体称为总体(pop
3、ulation)或母体,而把组成总体的每个单元称为个体。抽样要了解总体的分布规律,在统计分析工作中,往往是从总体中抽取一部分个体进行观测,这个过程称为抽样。样本与统计量子样子样是n个随机变量,抽取之后的观测数据称为样本值或子样观察值。在抽取过程中,每抽取一个个体,就是对总体X进行一次随机试验,每次抽取的n个个体,称为总体X的一个容量为n的样本(sample)或子样;其中样本中所包含的个体数量称为样本容量。随机抽样方法的基本要求独立性——即每次抽样的结果既不影响其余各次抽样的结果,也不受其它各次抽样结果的影响。满足上述两点要求的子样称为简单随机子样.获得简
4、单随机子样的抽样方法叫简单随机抽样.代表性——即子样()的每个分量与总体具有相同的概率分布。从简单随机子样的含义可知,样本是来自总体、与总体具有相同分布的随机变量.简单随机抽样例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。统计量定义设()为总体X的一个样本,为不含任何未知参数的连续函数,则称为样本()的一个统计量。则例如:设是从正态总体中抽取的一个样本,其中为已知参数,为未知参数,是统计量
5、不是统计量几个常用的统计量样本均值(samplemean)设是总体的一个样本,样本方差(samplevariance)样本均方差或标准差它们的观测值用相应的小写字母表示.反映总体X取值的平均,或反映总体X取值的离散程度。几个常用的统计量设是总体的一个样本,子样的K阶(原点)矩几个常用的统计量设是总体的一个样本,子样的K阶中心矩它包括两个方面——数据整理计算样本特征数数据的简单处理为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据。
6、计算样本特征数:数据的简单处理数据整理:将数据分组计算各组频数作频率分布表作频率直方图(1)反映趋势的特征数样本均值中位数:数据按大小顺序排列后,位置居中的那个数或居中的两个数的平均数。众数:样本中出现最多的那个数。数据的简单处理(2)反映分散程度的特征数:极差、四分位差极差——样本数据中最大值与最小值之差,四分位数——将样本数据依概率分为四等份的3个数椐,依次称为第一、第二、第三四分位数。第一四分位数Q1:第二四分位数Q2:第三四分位数Q3:例1为对某小麦杂交组合F2代的株高X进行研究,抽取容量为100的样本,测试的原始数据记录如下(单位:厘米),试根
7、据以上数据,画出它的频率直方图,求随机变量X的分布状况。8788111917370929810594999198110989790839288869410299891049494929687949286102887590908084918294991029196949485888083816995809792961099180809410280869190838491879576909177103898885959210492958386818691898396867592第一.整理原始数据,加工为分组资料,作出频率分布表,画直方图,提取样本分布特征的信
8、息.步骤如下:1.找出数据中最小值m=69,最大值M=111,极差为M-m=42
此文档下载收益归作者所有