欢迎来到天天文库
浏览记录
ID:6348880
大小:28.08 KB
页数:12页
时间:2018-01-11
《stata回归分析完整步骤-吐血推荐》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、stata回归分析完整步骤——吐血推荐****下载连乘函数prod,方法为:finditdm71sortstkcddate//对公司和日期排序genr1=1+r//r为实际公司的股票收益率genr2=1+r_yq//r_yq为公司的预期股票收益率egenr3=prod(r1),by(stkcddate)//求每个公司事件日的累计复合收益率egenr4=prod(r2),by(stkcddate)//求每个公司事件日的累计预期的复合收益率genr=r4-r3captureclear(清空内存中的数据)capturelogclose(关闭所有打开的日志文件)setmem128m(设置用于s
2、tata使用的内存容量)setmoreoff(关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。)setmatsize4000(设置矩阵的最大阶数。我用的是不是太大了?)cdD:(进入数据所在的盘符和文件夹。和dos的命令行很相似。)logusing(文件名).log,replace(打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。)use(文件名),clear(打开数据文件。)(文件内容)logclos
3、e(关闭日志文件。)exit,clear(退出并清空内存中的数据。)假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。检查数据的重要命令包括codebook,su,ta,des和list。其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。ta空格后面加一个(或两个)变量名是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按大小排列的累积比率。des后面可以加任意个变量名,只要数据中有。它报告变量的存储的类型
4、,显示的格式和标签。标签中一般记录这个变量的定义和单位。list报告变量的观察值,可以用if或in来限制范围。所有这些命令都可以后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无力,打开stata亲自实验一下吧。顺带说点儿题外话。除了codebook之外,上述统计类的命令都属于r族命令(又称一般命令)。执行后都可以使用returnlist报告储存在r()中的统计结果。最典型的r族命令当属summarize。它会把样本量、均值、标准差、方差、最小值、最大值、总和等统计信息储存起来。你在执行su之后,只需敲入returnlist就可以得到所有这些信息。其实
5、,和一般命令的return命令类似,估计命令(又称e族命令)也有ereturn命令,具有报告,储存信息的功能。在更复杂的编程中,比如对回归分解,计算一些程序中无法直接计算的统计量,这些功能更是必不可少。检查数据时,先用codebook看一下它的值域和单位。如果有-9,-99这样的取值,查一下问卷中对缺失值的记录方法。确定它们是缺失值后,改为用点记录。命令是replace(变量名)=.if(变量名)==-9。再看一下用点记录的缺失值有多少,作为选用变量的一个依据。得到可用的数据后,我会给没有标签的变量加上注解。或者统一标签;或者统一变量的命名规则。更改变量名的命令是ren(原变量名)空格
6、(新变量名)。定义标签的命令是labelvar(变量名)空格”(标签内容)”。整齐划一的变量名有助于记忆,简明的标签有助于明确变量的单位等信息。如果你需要使用通过原始变量派生出的新变量,那么就需要了解gen,egen和replace这三个命令。gen和replace常常在一起使用。它们的基本语法是gen(或replace)空格(变量名)=(表达式)。二者的不同之处在于gen是生成新变量,replace是重新定义旧变量。虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个数不多,可以有两种方法生成。一种是简明方法:gen空格(变量名)=((限制条件))[这外面的小括弧是命
7、令需要的,里面的小括弧不是命令需要的,只是说明“限制条件”并非命令]。如果某个观察满足限制条件,那么它的这个虚拟变量取值为1,否则为0。另一种要麻烦一点。就是gen(变量名)=1if(取值为一限制条件)replace(相同的变量名)=0if(取值为零的限制条件)两个方法貌似一样,但有一个小小的区别。如果限制条件中使用的变量都没有任何缺失值,那么两种方法的结果一样。如果有缺失值,第一种方法会把是缺失值的观察的虚拟变量都定义为0。而第二种方法可以将
此文档下载收益归作者所有