语言统计第五章概率与概率分布

语言统计第五章概率与概率分布

ID:43525146

大小:465.50 KB

页数:33页

时间:2019-10-09

语言统计第五章概率与概率分布_第1页
语言统计第五章概率与概率分布_第2页
语言统计第五章概率与概率分布_第3页
语言统计第五章概率与概率分布_第4页
语言统计第五章概率与概率分布_第5页
资源描述:

《语言统计第五章概率与概率分布》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章概率与概率分布第一节概率的基本概念一、后验概率二、先验概率第二节随机变量及其概率分布第三节正态分布一、正态分布的特征二、正态分布表三、正态分布表的用法四、正态分布理论的实际应用五、检验分布是否为正态的方法在语言实验研究中,我们通常选取研究对象的一部分(即样本)加以研究,在此基础上,通过推断统计对所有的研究对象(即总体)的情况作出推断。在进行这种推断时,我们不仅要指出总休可能是什么情况,而且还要指出我们进行这种推断的把握程度有多大,或者总体出现这种情况的可能性有多大,这个“可能性”就是概率。因此,要学好推断统计,就要对概率这一概念有所了解。第一节 概率的基本概念简而言之,

2、概率就是在某种条件下,某个事件出现的可能性。显然,这个事件可能会出现,也可能不出现,所以通常称之为“随机事件”。概率可分为两类:“后验概率”与“先验概率”。一、后验概率后验概率(或统计概率)是指通过实际观测,根据在总观测次数中某事件所出现的次数来计算该事件出现的概率,这种概率其实是一个相对频率,是实际概率的估计值。一般用A代表随机事件(例如“全体学生中的男生”),用P代表频率(概率估计值),或用n表示观测的次数,用m表示事件出现的次数,则(5.1)二、先验概率当可能出现的情况(叫做“基本事件”)是有限的,而且其出现的可能性相等时,所计算的概率称为“先验概率”或“古典概率”(无

3、需经过实际观测)。用n表示基本事件的总数,用m表示事件A所包括的基本事件,用P代表概率,则(5.2)第二节 随机变量及其概率分布随机变量是指在实验中受随机(或偶然)因素的影响,其取值无法进行准确预测的变量。譬如,我们要随机选取一些学生,来调查其家庭的人口数,“人口数”是一个随机变量,因为它可以取这一个值,也可以取那一个值,究竟取哪一个值完全是偶然的,无法碗切地预测,这要等到实验(实际抽取)之后才能得知。我们可以用某种方法对随机变量可取数值的概率分布进行描述,这就是随机变量的概率分布。第三节 正态分布正态分布也叫正态曲线,有时也称作高斯分布或高斯曲线。正态分布其实是次数分布的其

4、中一种,但是它在统计学中(尤其是推断统计中)具有特殊的重要性。首先,在自然界、现实生活以及我们的语言研究中,许多现象或特征都是呈正态分布。就统计工作本身来讲,正态分布具有一些特殊的数学特征,使得我们能够预测总体中多大比例的个体将会在一定范围内取正态分布的变量的某些值,此外,一些重要的差异显著性检验也要求所涉及的变量呈正态分布(见第七章)。一、正态分布的特征正态分布主要具有以下几个特征:(1)其形状如钟,中央点(最高点)为平均数点,整个分布以过该点的垂线左右对称,横坐标代表标准差,即横坐标上各点表示离开平均数的标准差单位数,曲线两端向靠近横坐标处无限延伸,但永远不能与之相交(见

5、图5.1)(2)在正态分布的中央点,平均数、中数与众数相等或重合(见图5.1)。(3)正态曲线完全是由平均数和标准差两个参数碗定的。有了这两个值,就可以利用正态分布的密度函数绘出正态曲线。当随机变量的平均数与标准差的值不同时,正态分布就会呈现不同的形态。在平均数相同的情况下,标准差大的正态曲线低平宽阔,而小的则高尖狭窄。但是我们可以把一个正态分布里的观测值换算成标准分(见第四章),即把原来的随机变量转换成一个标准正态变量,这样就可以把各种不同形态的正态分布转换成标准正态分布。(4)在曲线下,从任一标准差(整数或小数均可)作垂线,截取的“尾巴”所占总面积的比例都可以精确地计算出

6、来。任一标准差与平均数之间的面积也可以精确地计算出来。任何两个标准差之间的面积也是固定的。正态曲线下的总面积为1,因而任一面积与总面积之比(即该面积本身)可以视为随机变量的值出现的概率。当直方形的宽度(即分组区间)相等时,各直方形的面积与相应的分组区间的数值的次数或频率也是成比例的,而数值出现的次数与总次数之比就是数值出现的概率。标准差与正态曲线下的面积的对应关系见图5.2二、正态分布表由于任何形态的正态分布都可以转换成标准正态分布,我们就有可能依据标准正态分布编制一个通用的表,列出与各Z值相对应的正态曲线下的面积(或概率),这就是正态分布表(附表2)。当我们想知道一个正态分

7、布中的某个观测值所对应的面积时,或者已知面积,求相对应的观测值时,就不用一一计算了,只要把观测值换算成标准分,然后查正态分布表即可得到答案。三、正态分布表的用法1.由Z值查A值(1)查某Z值与平均数之间的面积。先在第一列找到要查的Z值,其后的数值即是该Z值值与平均数之间所夹的面积。例如:(2)查某Z值以上或以下的面积(即该Z值所截去的尾巴的面积)。由于表中A值为某Z值与平均数之间的面积,而平均数以上或以下(即平均数右侧或左侧)的面积各占曲线下总面积的一半,所以,在按照上述方法查到A值之后,还要进行一些简

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。