欢迎来到天天文库
浏览记录
ID:52457425
大小:459.50 KB
页数:24页
时间:2020-04-07
《SAS课件——第17讲-假设检验.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、均值的假设检验样本均值的检验问题,可用前面介绍的三个执行描述性统计分析功能的过程来完成。这里我们用univariate过程和means过程分别演示这种分析的SAS编程实现方法,summary过程的操作方法各位可以自己试着练习一下。以Means过程实现对单变量分布位置的t检验,只需在procmeans语句后添加t和probt(以前的版本为prt,SAS8.2中也可通用)两个选项,SAS即给出样本均数与0比较的t检验值和t分布曲线下该t值对应的双侧尾部面积(P-Value,Sig.)。univariate过程在默认状态下即可给出单变量分布
2、位置的t检验结果。例:现在有一组100名学生的身高和体重数据,保存为wh100数据集,试检验学生的体重数据的均值是否有μ=62kg?并求μ的置信区间(α=0.05)。12由于means过程的t检验只能检验均值为0的假设,故要对原数据集的变量进行变换。其中的probt选项要求给出t检验统计量的Sig.选项clm要求给出置信上下限。libnamecelon‘D:SAS_Teach’;datay100(keep=y);setcelon.wh100;y=w-62;run;procmeansdata=y100tprobtclm;vary;r
3、un;3该过程不仅会给出所有探索性数据分析的结果,而且会给出如上所示的均值假设检验结果,包括t检验法、符号检验法和符号秩检验法,后两种检验法均是非参数检验方法。该过程的两个参数mu0和alpha分别指定要检验的均值和显著性水平。libnamecelon‘D:SAS_Teach’;procunivariatedata=celon.wh100mu0=3.30alpha=0.05;varw;run;4这里我们顺便演示一下univariate过程绘制直方图的方法。histogram语句用来指示univariate过程对变量w绘制直方图,其
4、后的normal选项指示在直方图上拟合并绘制出正态分布的密度曲线;cbarline=green选项用来指定条形的边框颜色,此处表示将条形的边框显示为绿色;cfill=red选项用来指定条形内部的填充色,此处设置为红色;这里的‘barwidth=’选项和gchart过程中vbar语句后的‘width=’选项含义完全相同,用来指定条形的宽度,此处设置为8个字符宽度;‘midpoints=’选项则和gchart过程中vbar语句后的‘midpoints=’选项在含义及使用方法上完全相同,用来设定组中值的起始位置和步长。libnamecelo
5、n‘D:SAS_Teach’;procunivariatedata=celon.wh100mu0=62alpha=0.05;varw;histogramw/normalcbarline=greencfill=redbarwidth=8 midpoints=46to77by2;run;56两组比较独立组包含两个独立样本的观测数据,如男女身高的样本、男女会计师输入的问题等等;成对组各组数据有成对关系,如用药前后的症状、修完课程前后的考试成绩、施肥前后的生长状况等;71.独立组例:将14只大白鼠随机分为两组,一组做成白血病模型鼠,一组
6、为正常鼠,两组鼠脾脏DNA含量(mg/g)如下,请分析两组鼠脾脏DNA平均含量是否不同?白血病组(x1):12.313.213.715.215.415.816.9正常组(x2):10.811.612.312.713.513.514.8libnamecelon‘D:SAS_Teach’;datacelon.data3_3;inputxg$@@;cards;12.3113.2113.7115.2115.4115.8116.9110.8211.6212.3212.7213.5213.5214.82;run;procsortdata=ce
7、lon.data3_3;byg;procmeansdata=celon.data3_3;byg;varx;run;8上述过程只是简单的给出了描述统计,但是还是不知道这两组是否有显著性差异。要完成这个任务,需要用到TTEST过程。9libnamecelon‘D:SAS_Teach’;datacelon.data3_3;inputxg$@@;cards;12.3113.2113.7115.2115.4115.8116.9110.8211.6212.3212.7213.5213.5214.82;run;procttestdata=cel
8、on.data3_3;classg;varx;run;指定分组变量10结果中第一个表格给出两组数据的描述性统计量以及描述两组差值的若干指标,第二个表格给出t检验的结果,分别给出方差齐和不齐两种情况下的t检验结果和近似结果
此文档下载收益归作者所有