2014年sas大赛第三题.doc

2014年sas大赛第三题.doc

ID:55120930

大小:1.41 MB

页数:13页

时间:2020-04-27

2014年sas大赛第三题.doc_第1页
2014年sas大赛第三题.doc_第2页
2014年sas大赛第三题.doc_第3页
2014年sas大赛第三题.doc_第4页
2014年sas大赛第三题.doc_第5页
资源描述:

《2014年sas大赛第三题.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、题目:数据集timeser_com中存放着某地区每个电信基站的通话时长和短信包信息。date代表时间变量,Cell代表基站编码,tcherl和sms分别代表通话和短信量。问题如下:(1)根据date创建时间变量date_new;(2)清理数据,根据CELL和date_new变量剔除重复记录,对tcherl和sms使用三次样条曲线进行插值;(3)ARIMA过程步识ARIMA(p,d,q)滞后阶数并简要说明确定该模型的原因(提示:通过单位根检验检验差分阶数的合理性);(4)估计得到的模型系数,对每个基站的

2、tcherl和sms两个变量进行向前30步的预测数据。解答:(1)程序:datatimese;setvoice;date_new=input(put(date,8.),yynndd8.);formatdatedate9.;run;原数据集新建的date_new变量(1)删除重复记录:程序:procsortdata=timeseout=timese;bydatecell;run;datatimes_new;settimese;bydatecell;if^first.cellthendelete;run;

3、三次插值(考虑站点cell=D37C072)频数分布情况:程序:procfreqdata=times_new;tablecell;run;D37C0631330.0498673.15D37C0712140.07100813.22D37C0722140.07102953.29D37C0732140.07105093.36D37C0811330.04106423.40D37C0821330.04107753.44D37C0831330.04109083.48三次插值:程序:prociml;a=shape(

4、1,226,1);createdatesfroma[colname='date_new'];appendfroma;run;quit;datadates;setdates;date_new=intnx('day','04may09'd,_n_-1);formatdate_newdate9.;run;procsql;createtabledate_newasselectdate_newfromdateswheredate_newnotin(selectdate_newfromdate);run;data

5、date_new;setdate_newdate;run;procsortdata=date_new;bydate_new;run;procexpanddata=date_newout=date_new2method=spline;iddate_new;run;未插值前数据:插值之后:(1)程序:procgplotdata=data_f;plottcherl*time;symbolcolor=redL=1i=spline;run;Tcherl*time;程序:procarimadata=data_f;

6、identifyvar=tcherl;run;datadata_f;setdata_f;z=dif(tcherl);run;可以看出自相关函数出现缓慢衰减,而且后面的值并没有在两倍标准误差的范围内所以不认为它是平稳的序列从偏自相关函数可以看出7阶截断,P<<<0.05,拒绝原假设,所以认为它是非白噪声序列,即对序列建模是有意义的。可以发现AR6,MA6的值3.687501最小,ARMA(6,6)的BIC信息量最小,所以选择ARMA(5,6)模型拟合原序列由于是非平稳的所以做一阶差分程序:datadat

7、a_f;setdata_f;z=dif(tcherl);run;procgplotdata=data_f;plottcherl*time=1z*time=2/overlay;symbol1c=redl=1i=spline;symbol2c=greenl=1i=spline;run;程序:procarimadata=data_f;identifyvar=tcherl(1);run;、检验其自相关函数,偏自相关函数、发现自相关函数下降的很快,很快接近于零,而且lag=3后面的值基本落在2倍标准误差里面,所

8、以可以认为是平稳的。而且是非白噪声序列Procarimadata_f;Identifyvar=tcherlstationarity=(adf=1);run;ADF检验中,三个模型只要有一个拒绝原假设,就可以认为序列式平稳的;显然后面两个模型,P值<0.05拒绝原假设,所以序列式平稳的procarimadata=data_f;identifyvar=tcherl(1)minicp=(0:6)q=(0:6);estimatep=6method=cls;for

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。