资源描述:
《遗传学中概率与统计.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、遗传学中的概率与统计学习本课程的意义和注意事项一、统计数总体:是指研究的全部对象.分为有限总体和无限总体。样本:是总体的一部分,其所含的个体的数目或样本大小称为样本含量。参数:描述总体的特征数叫参数。统计数:反映样本的特征数叫统计数。如样本平均数等。(一)平均数平均数是数据的代表值,表示资料中观察值的中心位置。1.算术平均数2.几何平均数G=(二)变异数:常用的有方差、标准差和变异系数。,自由度=n-1。(通常总体与样本的方差分别用σ2和s2表示)。(试证明B=时,最小)。二、概率与概率分布(一)事件的基本概念
2、随机实验(trial,不同于experiment):对某一个个体的一次观测称为一次”随机试验”.基本事件:随机试验可能出现的每一结果称为”随机试验”或”基本事件”.随机试验的结果事先无法肯定。事件:若干基本事件的集合称为“事件”。全部基本事件的集合称为“样本空间(W)”。必然事件:每次试验中,一定出现的结果。不可能事件(V):任何一次试验中,都不出现的结果。事件的运算:略。(和事件,积事件,互斥事件,对立事件)(二)频率与概率6/6频率:某随机试验共进行k次,事件A发生了l次,则称l/k是k次随机试验中事件A发
3、生的频率。概率:随着的增大,l/k将围绕某一确定的常数p做平均幅度越来越小的变动。频率的稳定值p即为事件A的概率。概率是事件在实验结果中出现可能性大小的定量计量。文档来源网络及个人整理,勿用作商业用途概率的性质:0≤P(A)≤1P(W)=1P(V)=0事件的独立性:事件A发生与否不影响事件B发生的可能性,反之亦然,那么就称事件A对于事件B是独立的。简称独立事件。文档来源网络及个人整理,勿用作商业用途古典概率模型:对于以下随机现象,称为古典概率模型:(1)随机试验的全部可能的结果(基本事件数)是有限的;(2)各基
4、本事件间是互不相容且等可能的。则有:m=事件A中所包含的基本事件数;n=基本事件总数(三)概率的一般运算1.概率的加法定理:P(A∪B)=P(A)+P(B)-P(A∩B)P(A)+P()=12.条件概率:已知事件B发生的条件下,事件A发生的条件概率,记作P(A/B)3.概率的乘法定理P(AB)=P(B)P(A/B)=p(A)P(B/A)若事件A与事件B独立,则P(AB)=P(A)P(B)4.全概率公式W为n个互不相容的事件Ai之和,,有5.贝叶斯(Bayes)定理6/6(四)概率分布随机变量:随机实验中测定的量
5、。随机试验的结果用数字表示。离散型随机变量:随机变量只有有限个或可列个可能的取值。变量XX1X2……Xn概率pp1p2……pnp1+p2+……+pn=1连续型随机变量:取值在某个区间内连续变化。1.二项分布特征i.每次试验有两种互不相容的结果;ii.每一种结果都有恒定的概率;iii.试验之间是独立的。则有概率函数:x=0,1,2,……nn:随机试验次数x:n次试验中,事件A出现的次数p:在一次随机试验中,事件A发生的概率q:Ā发生的概率,q=1-pP(x):即P(X=x)2.普阿松分布为二项分布的特例。在二项分
6、布中,若p→0n→∞np=μ则有概率函数:6/6x=0,1,2,…3.正态分布对于连续型随机变量,考虑某一单个测量值所对应的概率是没有意义的,只能是某一范围或某一区间所对应的概率。文档来源网络及个人整理,勿用作商业用途用概率密度函数代替离散型变量的“概率函数”正态分布的概率密度函数-∞0其中为μ平均数,σ为标准差.X~N(μ,σ2)正态分布曲线的特性:(1)左右对称。(2)确定了m和s后,才能确定曲线位置和形状。正态曲线的任何两个x的定值间的面积或概率完全以曲线m和s而确定。文档来源网络及个人整
7、理,勿用作商业用途(3)平均数所在点的f(x)值最大;(4)正态分布曲线在c=m±1s处有拐点;x®±¥时,分布曲线以x轴为渐近线。(5)正态分布曲线与y轴之间的总面积等于1。随机变量X可被标准化,则U服从标准正态分布U~N(0,1)6/6三、抽样分布抽样分布(samplingdistribution):在已知的总体中,独立随机地抽取含量为n的样本,研究所得样本及其统计量的概率分布。文档来源网络及个人整理,勿用作商业用途1.样本平均数的分布若从一个正态总体中抽样,得到一系列的,设想这些组成一个新的总体,则该总体
8、的平均数,即样本平均数服从正态分布:~N(μ,σ2/n)称为平均数的标准误。标准化:,U~N(0,1)2.样本方差的分布若从一个方差为σ2的正态总体中抽样,随机抽取含量为n6/6的样本,得到一系列的S2,则6/6