stata命令总结

stata命令总结

ID:32367075

大小:39.50 KB

页数:7页

时间:2019-02-03

stata命令总结_第1页
stata命令总结_第2页
stata命令总结_第3页
stata命令总结_第4页
stata命令总结_第5页
资源描述:

《stata命令总结》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、stata11常用命令注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk检验刚好相反;dta为数据文件;gph为图文件;do为程序文件;注意stata要区别大小写;不得用作用户变量名:_all_n_N_skip_b_coef_cons_pi_pred_rc_weightdoublefloatlongintinifusingwith命令:读入数据一种方式input x y1         4 2       5.5 3       6.2 4       7.7 5       8.5 endsu/summarise/sumx或su/summarise

2、/sumx,d对分组的描述:sortgroupbygroup:sux%%%%%tabstateconomy,stats(max) %返回变量economy的最大值%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,%%     sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位%%     数,类似地有p10,p25,p50,p75,p95,p99),iqr(interquantilerange=p75–p25)_all %描述全部_N数据库中观察值的总个数。_

3、n当前观察值的位置。_pi圆周率π的数值。listgen/generate%产生数列egenwagemax=max(wage)clearuseby(分组变量)setmore1/0count%计数gsort +x (升序)gsort -x (降序)sortx    升序;并且其它变量顺序会跟着改变labelvary"消费" %添加标签describe%描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storagetype),标签(label)replacex5=2*yifx!=3%替换变量值replaceage=25in107 %令第107个观测中age为2

4、5renamey2u %改变变量名dropin2 %删除全部变量的第2行dropifx==.删去x为缺失值的所有记录keepifx<2 %保留小于2的数据,其余变量跟随x改变keepin2/10 %保留第2-10个数keepx1-x5  %保留数据库中介于x1和x5间的所有变量(包括x1和x5),其余变量删除cix1x2,by(group) %算出置信区间,不过先前对group要先排序,即sortgroup;%by的意思逐个进行cii123.8166670.2710343,level(90) %已知均值,方差,计算90%的置信区间cii102 %obs=10,mean=2,以二项分

5、布形式,计算置信区间centilex,centile(2.525507597.5) %取分位数correlate/corrxyz %相关系数pwcorrxy,sig  %给出原假设r=0的命令%如果变量非服从正态分布,则spearmanxyregress/regmeanyear%回归方程建立regyx,noconstant%无常数项predictmeanhat   %预测拟合值predicte,residual%得到残差estathettest %异方差检验dwstat  %Durbin-Watson自相关检验vif     %方差膨胀因子logityx1x2x3(y取0或1,是被

6、解释变量,x1-x3是被解释变量)%logit回归probityx1x2x3(y取0或1,是被解释变量,x1-x3是被解释变量)%probit回归tobityx1x2x3(y取值在0和1之间,是被解释变量,x1-x3是被解释变量)%tobit回归skteste%残差正态性检验p>0.05则接受原假设,即服从正态分布;%%sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)swilkx %基于Shapiro-Wilk检验%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布xi %生成虚拟变量tabulatgender,summ(math) %用gender

7、指标对math进行分类,返回两类math的mean、std、freqtabulate=tab%genf=int((shengao-164)/3)*3+164组距为3tabulate变量名[,generate(新变量)missingnofreqnolabelplot]%%%%%generate(新变量)//按分组变量产生哑变量nofreq          //不显示频数nolabel         //不显示数值标记plot            //显示各组频数图

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。