资源描述:
《专题二 数据的统计分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数学建模专题二数据的统计分析Lxy,ChinaJiliangUniversty现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。本专题的主要目的是:熟悉各种常见分布的概率密度函数及其曲线,会利用数据分布的形态猜测其分布类型;能够对密度函数进行参数估计;进行简单的正态假设检验。引言Lxy,ChinaJiliangUniversty内容提纲1.Matlab相关命令介绍2.常见概率分布3.频数直方图与频数表4.参数
2、估计5.假设检验Lxy,ChinaJiliangUniverstyMatlab相关命令对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)基本统计量Lxy,ChinaJiliangUniversty偏度和峰度的说明Lxy,ChinaJiliangUniverstyMatlab相关命令介绍pdf概率密度函数y=pdf(name,x,A)y=pdf(name,x,A,B)或y=
3、pdf(name,x,A,B,C)返回由name指定的单参数分布的概率密度,x为样本数据name用来指定分布类型,其取值可以是:'beta'、'bino'、'chi2'、'exp'、'ev'、'f'、'gam'、'gev'、'gp'、'geo'、'hyge'、'logn'、'nbin'、'ncf'、'nct'、'ncx2'、'norm'、'poiss'、'rayl'、't'、'unif'、'unid'、'wbl'。返回由name指定的双参数或三参数分布的概率密度Lxy,ChinaJiliangUniv
4、erstyMatlab相关命令介绍例:x=-8:0.1:8;y=pdf('norm',x,0,1);y1=pdf('norm',x,1,2);plot(x,y,x,y1,':')注:y=pdf('norm',x,0,1)y=normpdf(x,0,1)相类似地,y=pdf('beta',x,A,B)y=betapdf(x,A,B)y=pdf('bino,x,N,p)y=binopdf(x,N,p)…………Lxy,ChinaJiliangUniverstyMatlab相关命令介绍normfit正态分布中
5、的参数估计[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)对样本数据x进行参数估计,并计算置信度为1-alpha的置信区间alpha可以省略,缺省值为0.05,即置信度为95%hist绘制给定数据的直方图hist(x,m)Lxy,ChinaJiliangUniverstyMatlab相关命令介绍table=tabulate(x)绘制频数表,返回值table中,第一列为x的值,第二列为该值出现的次数,最后一列包含每个值的百分比。ttest(x,m,alpha)
6、假设检验函数。此函数对样本数据x进行显著性水平为alpha的t假设检验,以检验正态分布样本x(标准差未知)的均值是否为m。Lxy,ChinaJiliangUniversty总体方差sigma2未知时,总体均值的检验使用t-检验[h,sig,ci]=ttest(x,m,alpha,tail)检验数据x的关于均值的某一假设是否成立,其中alpha为显著性水平,究竟检验什么假设取决于tail的取值:tail=0,检验假设“x的均值等于m”tail=1,检验假设“x的均值大于m”tail=-1,检验假设“x的
7、均值小于m”tail的缺省值为0,alpha的缺省值为0.05.返回值h为一个布尔值,h=1表示可以拒绝假设,h=0表示不可以拒绝假设,sig为假设成立的概率,ci为均值的1-alpha置信区间.ttest说明Lxy,ChinaJiliangUniversty例Matlab统计工具箱中的数据文件gas.mat.中提供了美国1993年一月份和二月份的汽油平均价格(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差未知,试检验一月份油价的均值是
8、否等于115.解作假设:m=115.首先取出数据,用以下命令:loadgas然后用以下命令检验[h,sig,ci]=ttest(price2,115)返回:h=1,sig=4.9517e-004,ci=[116.8120.2].检验结果:1.布尔变量h=1,表示拒绝零假设.说明提出的假设油价均值115是不合理的.2.95%的置信区间为[116.8120.2],它不包括115,故不能接受假设.3.sig-值为4.9517e-004,远小于0.5,不能接受零