资源描述:
《数据的统计分析与描述.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、统计工具箱中的基本统计命令1.数据的录入、保存和调用2.基本统计量3.常见的概率分布函数4.频数直方图的描绘5.参数估计6.假设检验7.综合实例返回8/7/20211一、数据的录入、保存和调用例1上海市区社会商品零售总额和全民所有制职工工资总额的数据如下:统计工具箱中的基本统计命令8/7/202121.年份数据以1为增量,用产生向量的方法输入.命令格式:t=78:872.分别以x和y代表变量职工工资总额和商品零售总额.x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73
2、.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3.将变量t、x、y的数据保存在文件data中.savedatatxy4.进行统计分析时,调用数据文件data中的数据.loaddataToMATLAB(txy)方法18/7/20213二、基本统计量对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)返回8/7/20214
3、8/7/202158/7/202168/7/202178/7/202188/7/202198/7/2021108/7/202111例对例1中的职工工资总额x,可计算上述基本统计量.返回loaddatamean=mean(x)median=median(x)std=std(x)var=var(x)skewness=skewness(x)kurtosis=kurtosis(x)8/7/202112三、常见概率分布的函数MATLAB工具箱对每一种分布都提供5类函数,其命令字符为:概率密度:pdf概率分布:cdf逆概率分布:
4、inv均值与方差:stat随机数生成:rnd(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)8/7/202113在MATLAB中输入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1.密度函数:p=normpdf(x,mu,sigma)(当mu=0,sigma=1时可缺省)ToMATLAB(liti2)如对均值为mu、标准差为sigma的正态分布,举例如下:8/7/
5、202114ToMATLAB(liti3)3.逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X6、n).产生m×n阶的正态分布随机数矩阵.例6命令:M=normrnd([123;456],0.1,2,3)结果为:M=0.95672.01252.88543.83345.02886.1191ToMATLAB(liti6)此命令产生了2×3的正态分布随机数矩阵,各数分别服从分布:N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32).返回8/7/2021161.给出数组data的频数表的命令为:[N,X]=hist(data,k)此命令将区间[min(data),max(
7、data)]分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X.2.描绘数组data的频数直方图的命令为:hist(data,k)四、数直方图的描绘返回8/7/202117频数表和直方图8/7/202118图6.28/7/202119五、参数估计1.正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在显著性水平alpha下估计数据X的参数(alpha
8、缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区间估计,sigmaci是标准差的区间估计.8/7/2021202.其它分布的参数估计有两种处理办法:一、取容量充分大的样本(n>50),按中心极限定理,它近似地服从正态分布;二、使用MATLAB工具箱中具有特定分布总体的估计命令.