STATA统计软件操作.ppt

STATA统计软件操作.ppt

ID:50189483

大小:161.50 KB

页数:30页

时间:2020-03-06

STATA统计软件操作.ppt_第1页
STATA统计软件操作.ppt_第2页
STATA统计软件操作.ppt_第3页
STATA统计软件操作.ppt_第4页
STATA统计软件操作.ppt_第5页
资源描述:

《STATA统计软件操作.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、STATA统计软件操作Stata入门Stata的数据读入数据库的描述变量的生成与处理数据的合并数据的转换单变量描述双变量描述描述数据的统计量图形的制作参数估计:区间估计假设检验方差分析相关分析线性回归分析Stata入门五大功能:数据管理、统计分析、图形制作、矩阵运算和程序设计。界面:Command(命令)、Results(结果)、Review(回顾)、Variables(变量)。菜单基本功能:文件(File)、编辑(Edit)、偏好(Prefs,用户界面设置菜单)、数据(Data,数据的基本处理、描述、排序、改变变量、生成新变

2、量、整合数据、拆分数据等)、图表(Graphics)、统计(Statistics数据分析)、使用者(User)、窗口(Window)、帮助(help)快捷根据图表的基本功能:Log(记录文件窗口)、Viewer(帮助窗口)、Results(分析结果窗口)、Do-fileEditor(编程窗口)、DataEditor(数据编辑窗口)、DataBrowse(数据浏览窗口)、Clear-more-Condition(显示更多结果)、Break(不要显示更多结果)。Stata数据的读入log文件。创建文件:logusing“文件路径和

3、名称”,其后带append表示在原有文件的基础上增加新内容,其后带replace表示取代原记录文件;暂停:logoff;再次开始:logon;关闭:logclose。数据的存储空间:增加存储空间(setmem40m)清空存储空间(clear,相当于dropall)。Stata数据的读入数据的读入:可直接读入下列尾缀形式的数据.dta/.txt/.raw/.xls;读入文件中的部分变量:useabcusing“文件路径和名称”;读入文件中的部分样本:use“文件路径和名称”inX/Y(X、Y表示个案序号);读入文件中某些特征的样

4、本:use“文件路径和名称”if条件句;数据库的描述描述数据的基本情况:describe,ddescribe,simple:只展示变量名;describe,short:报告变量总体情况;describe,detail:输出全部变量的全部信息;describeabc:描述部分变量的情况。变量编码本:codebook。codebook+变量名:描述变量特征。Stata数据类型及特点与数据类型对应的是数据库中变量的存储类型(storagetype):。字符型:保存格式为str…,省略表示的是字符位数数值型:保存格式有byte,int

5、,long,float,double。默认格式是float,前三种只保留整数,占空间最大到最小的顺序是double,float,long,int,byte压缩变量的命令为compressCompress为压缩所有变量;Compressyr*为压缩共同前缀的变量;Compressa-c为压缩从a到c之间的所有变量。数据库的描述描述变量取值的基本命令参数:inspect。显示数据:browse直接进入数据的浏览窗口;list最好指定变量,否则会输出数据中所有变量的分布。数据排序:sort。例:比较城乡孩子的性别bysorturba

6、n:inspectgirl或者sorturban然后byurban:inspectgirl.变量的生成与处理注意事项:不要使用新变量取代旧变量;充分了解原始变量的分布以及每个数值代表的含义;遵循不重不漏;将原始变量和新变量的取值进行对比,检查是否有误;注意原始变量的缺失值。使用gen…replace命令生成新变量;gen…replaceif共同使用形成分组变量recodev,gen(nv)recodevv的取值=nv的取值*=其他取值(*表示所有其他没有列出的数值),gen(新变量名)recodeyrsch0=011=112=

7、213=314=415=516=621=7*=.,gen(edu)变量的生成与处理生成分类变量:egen新变量命=cut(旧变量名),at(取值的下限)eg:egenagegrp1=cut(age),at(0,7,13,16,20)按照变量b的分类生成均值变量:egena_mean=mean(a),by(b)生成一个变量b和c的行均值变量(avg),忽略缺失值:egenavg=rmean(bc)生成标准数值:egenzweight=std(weight)计算每一年观察的样本,从而了解在每年的调查中,有多少相同的样本(或相同的个

8、体):gennumobs=count(personid),by(personidyear)数据的合并(纵向)纵向合并:作用:增加样本量命令:append菜单:Data-Combinedatasets-Appenddatasets;程序:appendusing“文件路径和名称”

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。