欢迎来到天天文库
浏览记录
ID:49205779
大小:788.50 KB
页数:51页
时间:2020-02-01
《5第五章 概率及概率分布.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第五章概率及概率分布概率的基本概念正态分布二项分布样本分布(1)后验概率(统计概率)的定义随机事件A在n次试验中出现m次,m与n的比值,就是随机事件A出现的频率(即相对频数)。随着试验次数n的无线增大,随机事件A的频率稳定于一个常数P,这个常数P就是随机事件A出现概率的近似值。概率的定义(2)先验概率(古典概率)的定义要求满足两个条件:1试验的所有可能结果是有限的;2每一种可能结果出现的可能性(概率)相等。若所有可能结果的总数为n,随机事件A包括m个可能结果,则事件A的概率为概率的定义(1)概率的公
2、理系统①任何一个随机事件A的概率都是在0与1之间的正数,即②必然事件(是指在一定条件下必然发生的事件)U的概率为1,即③不可能事件(是指在一定条件下必然不发生的事件)V的概率为0,即概率的基本性质(2)概率的加法定理两个互不相容事件A、B(是指在一次实验或调查研究中,若事件A发生则事件B就一定不发生)之和的概率,等于两个事件概率之和。写作:概率的基本性质(3)概率的乘法定理两个独立事件A、B(是指一个事件的出现对另一个事件的出现不发生影响)同时出现的概率等于该两事件概率的乘积。写作:概率的基本性质(
3、1)按随机变量是否具有连续性来分类,可分为离散分布与连续分布。(2)按分布函数的来源来分类,可分为经验分布(是指根据观察或实验所获得的数据而编制的次数分布或相对频数分布)与理论分布(一是指随机变量概率分布的函数—数学模型,二是指按某种数学模型计算出的总体的次数分布)。(3)按概率分布所描述的数据特征来分类,可分为基本随机变量分布与抽样分布。概率分布的类型正态分布曲线函数(密度函数)正态分布的特征μ=0μ=0、σ=1标准正态分布曲线=正态分布的标准差x=随机变量X的取值(-4、平均数=3.14159;e=2.71828正态分布中的μ、σ、N都是常量,在每个正态分布中,它们的变化会导致正态曲线(NORMALCURVE)不同,如下图,尽管平均数相同,但由于σ不同而正态分布的形态差异较大。正态分布的特征(1)正态分布的形式是对称的,它的对称轴是过平均数点的垂线。(2)正态分布的中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交。(3)正态曲线下的面积为1。正态曲线下各对应的横坐标(即标准5、差)处与平均数之间的面积可用积分公式加以计算:正态分布的特征正态分布的特征(4)正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位不同有不同的分布形态。(5)正态分布中各种差异量数的值皆有固定的比率。(6)在正态分布曲线下,标准差与概率(面积)有一定的数量关系。如:正负一个标准差之间,包含总面积的68.26%;正负1.96个标准差之间,包含总面积的95%;正负2.58个标准差之间,包含总面积的99%;正负3个标准差之间,包含总面积的99.74%。正态分布的特征正态分布的特征正态分布的特征正6、态分布表的编制本书附表1的正态分布表的编制,是从Z=0开始,逐渐变化Z分数,计算从Z=0至某一定值之间的概率。这是因为正态分布为对称分布,且对称轴为过Z=0点的纵线,故Z<0当时,其概率与Z>0时的相应的Z分数下的概率值相等。正态分布表的编制与结构正态分布表的结构正态分布表(参见附表1)一般包括三栏:第一栏是Z分数单位,一般标为Z。第二栏为密度函数或比率数值(Y),即某一Z分数点上的曲线纵坐标的高度。第三栏为概率值(P),即不同Z分数点与平均数之间的面积与总面积之比。正态分布表的编制与结构(1)依据7、Z分数求概率(P),即已知标准分数求面积。①求Z分数与平均数(Z=0)之间的概率;②求某Z分数以上或以下的概率;③求两个Z分数之间的概率。正态分布表的使用例1例2例3例4例5例6例7例8(2)从概率(P)求Z分数,即从面积求标准分数值。①已知从平均数开始的概率值求Z值;②已知位于正态分布两端的概率值求该概率值分界点的Z值;③若已知正态曲线下中央部分的概率,求Z分数是多少。(3)已知概率或Z值,求概率密度Y,即正态曲线的高。正态分布表的使用在正偏态中M>Md>M0,在负偏态中M<Md<M0,在正态分布8、中三者合于一点。皮尔逊发现在偏态分布中平均数距中数较近而离众数较远。根据平均数与众数或中数的距离,提出一个偏态量数公式,用以描述分布形态:当SK=0时,分布对称;当SK>0时,分布属正偏态;当SK<0时,分布属负偏态。次数分布是否正态的检验方法:——1皮尔逊偏态量数法(1)偏度系数当g1=0时,分布是对称的;当g1>0时,分布为正偏态;当g1<0时,分布呈负偏态。当观测数据数目N>200时,这个偏态系数的统计量才较可靠。次数分布是否正态的检验方法:——2峰度、偏度检验
4、平均数=3.14159;e=2.71828正态分布中的μ、σ、N都是常量,在每个正态分布中,它们的变化会导致正态曲线(NORMALCURVE)不同,如下图,尽管平均数相同,但由于σ不同而正态分布的形态差异较大。正态分布的特征(1)正态分布的形式是对称的,它的对称轴是过平均数点的垂线。(2)正态分布的中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交。(3)正态曲线下的面积为1。正态曲线下各对应的横坐标(即标准
5、差)处与平均数之间的面积可用积分公式加以计算:正态分布的特征正态分布的特征(4)正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位不同有不同的分布形态。(5)正态分布中各种差异量数的值皆有固定的比率。(6)在正态分布曲线下,标准差与概率(面积)有一定的数量关系。如:正负一个标准差之间,包含总面积的68.26%;正负1.96个标准差之间,包含总面积的95%;正负2.58个标准差之间,包含总面积的99%;正负3个标准差之间,包含总面积的99.74%。正态分布的特征正态分布的特征正态分布的特征正
6、态分布表的编制本书附表1的正态分布表的编制,是从Z=0开始,逐渐变化Z分数,计算从Z=0至某一定值之间的概率。这是因为正态分布为对称分布,且对称轴为过Z=0点的纵线,故Z<0当时,其概率与Z>0时的相应的Z分数下的概率值相等。正态分布表的编制与结构正态分布表的结构正态分布表(参见附表1)一般包括三栏:第一栏是Z分数单位,一般标为Z。第二栏为密度函数或比率数值(Y),即某一Z分数点上的曲线纵坐标的高度。第三栏为概率值(P),即不同Z分数点与平均数之间的面积与总面积之比。正态分布表的编制与结构(1)依据
7、Z分数求概率(P),即已知标准分数求面积。①求Z分数与平均数(Z=0)之间的概率;②求某Z分数以上或以下的概率;③求两个Z分数之间的概率。正态分布表的使用例1例2例3例4例5例6例7例8(2)从概率(P)求Z分数,即从面积求标准分数值。①已知从平均数开始的概率值求Z值;②已知位于正态分布两端的概率值求该概率值分界点的Z值;③若已知正态曲线下中央部分的概率,求Z分数是多少。(3)已知概率或Z值,求概率密度Y,即正态曲线的高。正态分布表的使用在正偏态中M>Md>M0,在负偏态中M<Md<M0,在正态分布
8、中三者合于一点。皮尔逊发现在偏态分布中平均数距中数较近而离众数较远。根据平均数与众数或中数的距离,提出一个偏态量数公式,用以描述分布形态:当SK=0时,分布对称;当SK>0时,分布属正偏态;当SK<0时,分布属负偏态。次数分布是否正态的检验方法:——1皮尔逊偏态量数法(1)偏度系数当g1=0时,分布是对称的;当g1>0时,分布为正偏态;当g1<0时,分布呈负偏态。当观测数据数目N>200时,这个偏态系数的统计量才较可靠。次数分布是否正态的检验方法:——2峰度、偏度检验
此文档下载收益归作者所有