欢迎来到天天文库
浏览记录
ID:62260337
大小:338.50 KB
页数:44页
时间:2021-04-24
《最新stata中变量的生成与处理..幻灯片.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、stata中变量的生成与处理..导论Stata对数据的处理是以变量为前提的若没有需要分析的变量,则Stata将一无用处熟悉变量的内容和分布、生成新变量、改变旧变量等是处理数据的第一步4.1.新变量的生成、规则及注意事项生成变量的窗口Data—Createorchangevariables—Createnewvariable基本命令Stata有四个基本的生成和修改变量的命令:gen、egen、replace和recode.gen和egen分别是generate和extendedgenerate的缩写,它们用于生成新变量.replace和recode用来改
2、变现存变量的属性或数值.replace需要与gen一起使用;二者的区别在于,gen用于生成新变量,replace用于重新定义已经存在的变量.recode也可以与gen一起使用基本语法.gen[变量名]=[表达式1]①②③.replace[变量名]=[表达式2]if[条件]①②③④①:生成新变量或替代现存变量取值的基本命令②:新变量或其取值将被替换的变量的名称③:在gen命令的取值不同于在replace命令的取值④:替换原有变量的取值必须满足if指定的条件*yrofschoolingrecoded(这是一个注释;*代表注释)genedu=0replace
3、edu=1ifyrsch==11replaceedu=2ifyrsch==12replaceedu=3ifyrsch==13replaceedu=4ifyrsch==14replaceedu=5ifyrsch==15replaceedu=6ifyrsch==16replaceedu=7ifyrsch==21replaceedu=8ifyrsch==22replaceedu=9ifyrsch==23replaceedu=10ifyrsch==24
4、yrsch==27replaceedu=11ifyrsch==25
5、yrsch==28replaceedu=
6、12ifyrsch==26
7、yrsch==29replaceedu=13ifyrsch==31replaceedu=14ifyrsch==32replaceedu=15ifyrsch==33replaceedu=16ifyrsch==34replaceedu=17ifyrsch==35replaceedu=18ifyrsch==36replaceedu=.ifyrsch==.
8、yrsch==-9tab1yrschedu*查看变量的生成是否成功变量生成的规则(I)生成新变量、重新定义旧变量时需遵循的一些基本规则:变量的名称可长达32个字符,必须以字母、汉
9、字或字符(@,_,#,$等)开头(不能使用空白字符或!、?等特殊字符)。变量最后一个字符不能是句号变量的名称必须唯一,不能有两个相同的变量名Stata区分大小写,对大写、小写敏感:Variable不能写成variable,反之亦然使用描述性的变量名字:“变量a”这个名称没有任何意义。调查问题是变量名称的很好选择变量生成的注意事项尽量避免使用同一变量名称。换言之,不要使用新变量取代旧变量。保持原始变量有助于检验我们的命令是否正确充分了解原始变量的分布以及每个数值代表的含义遵循不重不漏(exhaustiveandmutuallyexclusive)原则(详
10、见“生成分组变量”一节)在变量生成后,将原始变量和新变量的取值进行对比,检查是否有误注意原始变量的缺失值4.2.利用系统变量或下划线变量(_n和_N)生成新变量Stata有几个下划线变量(_variables,读为“underscorevariables”),因包含下划线而得名。这类变量并不出现在Stata的Variables(变量)窗口中,故又称系统变量。其中,经常使用的有_n和_N。系统变量_n和_N对于数据的管理和处理十分有用,尤其是与特殊选项by同时使用时系统变量_n_n是指当前的观察值,即独一无二的观测序号,从1到_N(_N=总样本)_n是S
11、tata系统内部独特的辨识器,标志从第一个观察值开始直到最后一个观察值(_N)的序列_n=1为第一个观测,_n=2为第二个观测,…,_n=_N是最后一个观测该系统变量适于(1)指示观察值;(2)生成系列数值;(3)生成其他变量使用系统变量_n指示观察值系统变量_n表示每个观察值的位置(numberingobservations)。其原则是:当前观察值:[_n]总观察值(最后一个观察值[_n]):[_N]第一个观察值:[1]最后一个观察值:[_N]滞后一个(lag)观察值:[_n-1]前移一个(lead)观察值:[_n+1]第27个观察值:[27]假如现
12、有以下数据:+----------------------------------------
此文档下载收益归作者所有