资源描述:
《第三讲 stata数据管理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三讲Stata数据管理变量名称基本规则由英文字母、数字或_组成,不超过32个字首字母必须为字母或_英文字母大写和小写具有不同的含义示例abca1a2Gdp都是合理的变量名5gdp2invest则不是注意:建议不要使用“_”作为变量的首字母Stata的内部变量许多是以_开头的,如_n,_N,_b等。变量的取值类型字符型变量存储格式str#,#表示该变量存储最多可容纳的字符数如str7数值型变量整数(int)浮点(float)长整数(long)双浮点(float)日期型变量变量的显示格式数值型变量的显示格式e格式(科学计数法)f格式(固定格式)
2、g格式(一般格式)c格式(带千分符)如%9.0g,%9.0f,%9.0fc字符变量的显示格式%#s如%22s%-14s,其中“-”表示左对齐变量的显示格式日期型变量+---------------------------------------------------------------------+-----Numericalvalue&interpretation------FormatMeaningValue=-1Value=0Value=1--------+------------+---------------+--------
3、-------+---------------%tcclock31dec195901jan196001jan196023:59:59.99900:00:00.00000:00:00.001%tddays31dec195901jan196002jan1960%twweeks1959w521960w11960w2%tmmonths1959m121960m11960m2%tqquarters1959q41960q11960q2%thhalfyears1959h21960h11960h2%tggeneric-101+-----------------
4、----------------------------------------------------+字符型转为数值型destring:字符中还有特殊符号,如“-,%”等destringx,replaceignore(“-”)real():字符中没有特殊符号real(string)数值型转为字符型tostring:tostringx,replacetostringx,gen(x1)string:genx=string(y)字符变量的操作字符变量的分解:splitvar,parse(x)splitdate,parse(-)字符变量的合成:+
5、gena=b+cdis“Iam”+”ateacher”获取部分字符串:substr(x,t1,t2)“2004-01-03”substr(x,1,4)=“2004”变量的显示格式日期型变量如何将字符串变为数值以日期为例,命令date(string,mask)如genx=date(date,“MDY”)修改变量的格式format命令formatvarlist%fmtsysuseauto练习变量的标签标签是为变量、数据等提供说明,便于使用者更清晰的了解数据的结构和变量。label命令Labelvarname“label”Sysuseauto,cl
6、earLabelvarmake“make”基本数据操作命令browseeditrenamesavedescribelistcodebookdisplaysortStata中的表达式:算术表达式+—(减号或负号)*/^(乘方)dis(2+3*9^3)^0.5/6^3Stata中的表达式:关系和逻辑表达式==(等于)!=(不等于)><>=<=
7、(或)&(且)listifage<20listifage>20&age<50listifage<20
8、age>50数据子集的定义in命令:用于指定观测值,可以是某一个观测值,也可以是某个区间Listin20
9、/30Listin1/10Listin-10/-1if命令:如果Listifage==20by命令:非常重要用来对某些具有相同复制的样本子集重复执行命令byvarlist:stata_cmdBysortvarlist:stata_cmd如bysortsex:keepifage==20变量的相关操作产生新变量:generate命令genxy;genx=1;genx=x^2替换已有变量:replace命令(该命令不能缩写)replacex=2ifx=1产生特殊函数值的命令:egenegenx=mean(y)gendy=y-xgenx1=media
10、n(y)变量的相关操作产生新变量:generate命令genxy;genx=1;genx=x^2替换已有变量:replace命令(该命令不能缩写)replacex=