资源描述:
《概率与统计(理)MicrosoftWord文档.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、知识目标:1、统计概型、古典概型、几何概型2、抽样方法3、用样本估计总体(频率分布及数字特征)4、线性相关5、分布列(理)6、二项分布、条件概率(理)7、期望与方差(理)8、正态分布(理)9、统计案例(线性回归、独立性检验)。一、几何概型1.如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称几何概型2.几何概型有两个基本特点(1)无限性(2)等可能性3.事件A的概率P(A)只与子区域A的几何度量(长度或面积或体积)成正比,而与A的位置和形状无关。3.几何概
2、型中,事件A的计算公式(几何测度之比)、二、条件概率(1)设A,B为两个事件,且P(A)>0,在事件A发生的条件下,事件B发生的概率叫做条件概率。计作P(B/A),读作A发生的条件下B发生的概率。(2)公式及性质P(B/A)=(古典概型)==(几何概型);0≤P(B/A)≤1;如果B和C是两个互斥事件,则P(B∪C/A)=P(B/A)+P(C/A)三、统计:用样本估计总体:频率分布与特征数:期望(平均水平)和方差(稳定性)1、频率分布:I>频率分布有如下四类.①.频率分布表分组个数累计频数频率累积频率……………
3、合计容量1.00②.条形图、频数折线图、扇形图③.频率直方图④直方图折线图:连接频率分布直方图各小矩形上边中点得直方图折线图、※4.累积频率图II>频率=III>.1>在频率分布表中:各组频数之和为容量;各组频率之和为1.;某区域内频数(或频率)之和为该区域内频数(或频率)之和.2》在直方图中:纵坐标表示频率/组距;矩形的高之比=频率之比;矩形的面积之和为1.IV>在频率分布表、直方图中:总体与样本各组频率对应相等;各组频数之比对应相等且等于各组频率之比、还等于直方图中各组高之比;总体与样本直方图相同(因为各组
4、频率对应相等)、频率分布表不同(因为各组频数不同)。※V>在累积频率图中每组(即在累积频率图中表现为线段如上图AB)有该组线段斜率=..2..相关概念:总体取值的概率分布规律通常称为总体分布。当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线,统计中称为总体密度曲线.它能够更加精细地反映出总体在各个范围内取值的百分比;总体密度曲线反映了总体分布,即反映了各范围内取值的概率.它的几何意义如右图:图中阴影部分面积为(a,b)内取值的概率3.茎叶图①茎叶图:茎是指中间的一列数,叶就是从
5、茎的旁边生长出来的数,中间的数字表示得分的十位以上的数字,旁边的数字分别表示两个人得分的个位数。②.当样本数据较少时,用茎叶图表示数据效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便;但不能反映总体分布,还需通过数据求数字特征(平均数,方差)估计总体。4、用样本的数字特征估计总体的数字特征①.众数,中位数,平均数:众数——在一组数据中,出现次数最多的数据叫做众数。(理解;1.众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数.2.一组数据中的众数有时不只一
6、个,如数据2、3、-1、2、1、3中,2和3都出现了2次,它们都是这组数据的众数.)在频率分布直方图中可估计众数:最高矩形的中点。中位数——将一组数据按大小依次排列,把处在最中间位置一个数据(或最中间两个数的平均数)叫做中位数。(理解:1.求中位数要将一组数据按大小顺序排列,排序时,从小到大或从大到小都可以.中位数就是位置处于最中间的一个数(或最中间的两个数的平均数),2.在数据个数为奇数的情况下,中位数是这组数据中的一个数据;但在数据个数为偶数的情况下,其中位数是最中间两个数据的平均数,它不一定与这组数据中的
7、某个数据相等.)因为中位数左边和右边的直方图的面积相等,因此在频率分布直方图中可用此估计中位数;。平均数——样本数据的算术平均数,即;在频率分布直方图中可估计平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。(即)说明:平均数与每个数据有关,任何一个数据都会引起平均数的改变,中位数、众数不具有这个性质。②.样本方差,标准差:个体,样本,总体;样本及总体平均数;样本及总体容量;平均数及方差公式.:平均数=;的性质与E(a+b)=aE()+b;E(其中a,b,c为常量,为变量
8、)相同,方差的算术根s称为标准差,标准差越大数据越离散,标准差越小数据越集中。③.特殊情况:I>平均数(1)出现次数且).(2)当较大时,可同时减去一个适当数a得:II>方差(1)当较大时,可同时减去恰当数a得=(即数据与即的性质与D(a+b)=(a,b为常数)相同。3.(理)四、分布列:1、特殊分布①两点分布:如成功与失败问题.其分布列为01P1-pp说明:两点分布又称0——1分布,