欢迎来到天天文库
浏览记录
ID:52569865
大小:389.00 KB
页数:26页
时间:2020-04-10
《SAS基础与金融计算5.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1SAS基础与金融计算游家兴厦门大学经济学院计统系2上节课上机操作(1)对上节课生成的最终数据集total进行如下操作:(1)剔除金融业上市公司;(2)剔除每股收益为负的上市公司;(3)由于数据集中年涨跌幅采用百分比表示,建立一个新的变量,采用小数表示。(4)建立一个新的变量,表示除第一大股东外其它股东所持有的股份比例。3(1)剔除金融业上市公司第一步:运用substr语句Datatest;settotal;code=substr(code,1,6);Run;4第二步:Datatemp1;settest;ifcode='000562'orcode='000001'or
2、code='000563'orcode='600015'orcode='600016'orcode='600030'orcode='600036'orcode='600816'orcode='600000'orcode='601998'orcode='601328'orcode='601166'orcode='601318'orcode='601398'orcode='601628'thendelete;Run;5(2)剔除每股收益为负的上市公司Datatemp2;settemp1;ifeps<0thendelete;Run;Datatemp2;sett
3、emp1;ifeps>=0;Run;6(3)建立新变量:用小数表示的涨跌幅Datatemp3;settemp2;re2=re/100;Run;7(4)建立新的变量表示其它股东持股比例Datatemp4;settemp3;ratio2=1-ratio/100;Run;8本节课上机作业(2)公共信箱下载数据集test1和test2,运用SAS将test1和test2纵向拼成新的数据test。根据股票收益率大小将test分成四个组,并形成四个子数据集:tmp1,tmp2,tmp3,tmp4。在数据集test中,第一大股东持股比例在50%以上且每股收益超过1元的公司有多少家?
4、9描述统计分析常见的数据统计描述量及意义(1)表示分布平均水平和位置的特征量:均值:数据的平均值—Mean众数:观测值中出现最频繁的数值—Mode中位数:观测值排序中处于中间位置的值—Median百分位数:中位数的推广—P1、P33、P9910(2)表示分布离散程度的特征量标准差Std方差Var变异系数CV标准误STDEER11(3)表示形状的特征量:偏度和峰度偏度(Skewness):偏度主要用于判断分布形状是否对称:若g1=0,则对称;若g1>0,则分布右偏(正偏);若g1<0,则分布左偏(负偏)。12峰度(Kurtosis):峰度是以正态分布为比较标准。对于正态
5、分布,g2=0;若g2>0,表示变量分布比正态分布更集中,分布呈尖峰状态,平均数的代表性较好;若g2<0,表示变量分布比正态分布更分散,分布呈平坦峰,平均数的代表性较差。13SAS中可以对数据进行描述统计分析的过程步有很多,其中两个最常用的过程步是:(1)MEANS过程(均值过程)(2)UNIVARIATE过程(单变量过程)14MEANS过程用来对数据集中的数值变量计算简单描述统计量。该过程由下列语句控制:PROCMEANS[options][statistics-keywords];VARvariables;BYvariables;CLASSvariables;OU
6、TPUT[OUT=SAS-data-set][output-statistics];Run;1.MEANS过程15(1)PROCMEANS语句PROCMEANS[options][statistic-keywords][options]:DATA=SASdataset,即用以说明过程分析处理的数据集的名字,若省略,则用最近操作的SAS数据集;[statistic-keywords]:在MEANS过程中指出你需要计算哪些统计量。16N,MEAN,STD,MIN,MAX,SUM,Variance,CV,STDERR,T,PRT,Range,SKEWNESS,KURTOSI
7、S,CLM,LCLM,UCLM,Maxdec…T:检验总体平均值是否为0的T统计量的值PRT:大于T的概率Maxdec=n:指定打印统计量的小数位的位数如省略不写,SAS将固定输入默认的最常见的几个统计量。该过程可计算如下统计量:17VARvariables规定要计算描述性统计量的数值变量及顺序。若省略该句,则对除BY、CLASS语句中列出的变量之外所有数值变量计算描述性统计量。(2)VAR语句18(3)BY语句BYvariables;使用BY语句可以用BY变量定义的观测组分别计算其相应的描述统计量。当使用BY语句时,要求输入数据集已按BY变量排序。
此文档下载收益归作者所有