arima模型在乙型肝炎发病数预测中的应用

arima模型在乙型肝炎发病数预测中的应用

ID:27607025

大小:66.00 KB

页数:6页

时间:2018-12-05

上传者:U-991
arima模型在乙型肝炎发病数预测中的应用_第1页
arima模型在乙型肝炎发病数预测中的应用_第2页
arima模型在乙型肝炎发病数预测中的应用_第3页
arima模型在乙型肝炎发病数预测中的应用_第4页
arima模型在乙型肝炎发病数预测中的应用_第5页
资源描述:

《arima模型在乙型肝炎发病数预测中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

ARIMA模型在乙型肝炎发病数预测中的应用蔡晶黄淑琼杨雯雯湖北省疾病预防控制中心摘要:目的探讨自回归移动平均(ARIMA)模型在乙型肝炎(以下简称“乙肝”)发病数预测中的可行性,为预测乙肝发病趋势提供借鉴。方法利用“传染病报告信息管理系统”中湖北省2005—2016年乙肝分月发病数建立数据库,采用SPSS12.0拟合ARIMA模型并进行预测。结果乙肝发病数原始数据存在一定的季节性及长期趋势,为非平稳时间序列;经差分处理为平稳序列后拟合得到ARTMA(0,l,1)(0,1,1)12为最优模型,残差检验为白噪声序列;模型回代性预测的平均绝对误差百分比为5.377%,<10%;前瞻性预测显示2016年各月份的实际值均在预测值95%置信区间内,且与实际值的平均相对误差仅为3.94%;模型预测2017和2018年乙肝年发病数分别为67424、68819例。结论ARIMA模型能较好地模拟乙肝发病数在吋间序列上的变动趋势,将其应用于乙肝发病趋势的预测是可行的。关键词:ARIMA模型;肝炎,乙型;发病数;作者简介:蔡晶(1989—),女,硕士研宄生,医师,主要从事传染病监测及数据挖掘工作作者简介:黄淑琼,E-ma.il:48501247@qq.com收稿日期:2017-02-24基金:湖北省卫生计生委科研项目(项目编号:WJ2017M139)Received:2017-02-24时间序列是某•-指标在不同时间上的不同数值,按照时间顺序排列而成的数列m。时间序列分析就是通过挖掘数值序列随时间变化的规律,以预测事物未来某时刻的取值及发展趋势自回归移动平均(auto-regressiveintegratedmovingaverage,ARIMA)模型是时间序列分析方法中应用较多的一种模型,它综合考虑了数值序列的趋势变化、周期变化及随机干扰,对于处理非平稳时间序 列效果较好,被广泛应用于气象预测、病虫灾害预测及疾病预测等领域mi。木研究拟运用ARIMA模型对湖北省2005—2016年乙型肝炎(以下简称“乙肝”)分月发病数进行分析,并利用模型预测2017和2018年乙肝发病数,以探讨ARIMA模型在乙肝发病数预测屮的可行性,为预测乙肝发病趋势提供一定的借鉴。1材料和方法1.1资料来源乙肝分月发病数据来源于传染病报告信息管理系统。根据《传染病信息报告管理规范(2015版)》,传染病报告病例分为疑似病例、临床诊断病例、实验室确诊病例和病原携带者4类;其中,需报告病原携带者的病种包括霍乱、脊髓灰质炎以及W家卫生计生委规定的其他传染病;每年年底各省也会根据中疾控的文件要求对网络直报系统开展病例个案库的清理工作,因此数据能较为真实地反映疾病实际发病情况m。系统提供分月统计的发病数,统计规则选择按发病曰期统计,数据统计时间段设置为2005年1月1口0时至2016年12月31口24时,病例分类选择临床诊断病例和实验室确诊病例,得到2005-2016年各月份乙肝发病数。1.2分析方法采用SPSS12.0建立乙肝月发病数的数据库,运用ARTMA模型对序列进行处理和分析。ARIMA模型即齐次非平稳序列模型,用于处理非平稳时间序列,主要通过以下4个步骤进行建模:序列平稳化处理、模型阶数判定、模型参数估计及模型检验、模型预测应用U1。首先利用2005年1刀至2015年12刀发病数数据进行建模,再用2016年1一12月发病数数据验证拟合模型预测的外推效果,最后以2005年1月至2016年12月发病数数据作为基础,建立ARTMA模型,对2017和2018年乙肝发病情况进行预测。2结果2.1原始序列平稳化判定绘制原始序列的时序图如图1所示,从图形可以看出,原始序列表现出一定的季节性及长期趋势性,显然是非平稳的时间序列。其自相关系数(ACF)随着时滞的增加呈现出缓慢衰减,且在时滞12,24,……等处有峰态,进一步验证该序列是非平稳的,详见图2。图12005-2015年乙肝月发病数时序图下载原图 图22005—2015年乙肝月发病数序列自相关分析图下载原图2.2序列平稳化处理原始时间序列为非平稳时间序列,且表现出一定的季节性和长期趋势性,故分别采用1阶季节差分和1阶普通差分对原始序列进行预处理,以消除其季节因素和趋势性因素。分析经差分处理后序列的平稳性,其时序图在某一平稳值上下波动,>1.自相关系数(ACF)截尾、偏自相关系数(PACF)拖尾,可见差分处理后的序列为平稳时间序列,见图3、图4。图3经差分处理后序列的时序图下载原图图4经差分处理后序列的自相关分析图下载原图2.3模型阶数判定根据差分处理的次数,可以确定模型的形式为ARIMA(p,1,q)(P,1,Q)12,这是一个综合了连续模型和季节模型的复合季节模型;其中p、q和P、Q是待估计参数,分别表示连续模型和季节模型中的自冋归阶数和移动平均阶数,12表示季节模型以12个月为1个周期。p、q和P、Q的确定根据平稳序列的自相关、偏自相关系数确定,并结果模型拟合优度指标B1C进行筛选,最后得到最优模型。2.4模型参数估计和模型检验根据BTC值越小、模型越优的原则,得到没有常数项的ARTMA(0,1,1)(0,1,1)12为最优模型。参数估计显示,平均移动参数MA=0.612,季节移动平均参数SMA=0.707,参数的显著性检验显示都有统计学意义(MA:t=8.156,P<0.01;SMA:t二7.960,P<0.01)。模型检验显示,残差白噪声检验的Ljimg-BoxQ(18)=16.872,P=0.394>0.05,II残差的自相关和偏自相关系数均落在95%置信区间内,可见模型拟合后的残差序列为白噪声序列,说明模型提取信息充分,具有统计学意义。2.5模型预测效果考核模型的预测效果考核可分为[Hi代性考核和前瞻性考核。(1)lEl代性考核:采用模 型对2005-2015年湖北省乙肝发病数进行预测,得到的预测值与实际值较为接近,实际值均在预测值95%置信区间内,II实际值与预测值的平均绝对误差百分比MAPE=5.377%〈10%,显示模型预测精度较高。(2)前瞻性考核:采用模型预测2016年1一12月发病数,并与其实际值进行比较,结果显示所有月份的实际值均在预测值95%罝信区间内,且与实际值的平均和对误差仅为3.94%,另外,预测值与实际值的图形显示,预测值与实际值高度吻合,见图5,说明ARIMA模型可用于对湖北省乙肝发病情况进行预测。阁52016年模型预测值与实际值数据比较阁下载原阁2.6模型预测应用模型检验及预测效果考核均显示模型预测精度较高,可用于乙肝发病数的预测。以2005年1月至2016年12月发病数数据为基础,得到最优模型ARTMA(0,1,1)(0,1,1)12,其表达式为:(1-B)(1-B)xt=(1-0.606B)(1-0.708B)ut,其中xt为时间序列值,为随机干扰。运用该模型对2017和2018年各月份乙肝发病数进行预测,结果显示3月发病数均最高,其次为7月,且3—8月发病数均处于较高水平,随后发病数开始下降,并在10月出现小幅上升,至12月降至最低。模型预测2017和2018年乙肝年发病数分别为67424、68819例,详见表1。表1AR1MA模型预测2017-2018年湖北省乙肝发病数下载原表3讨论我国于2004年建立了疾病监测网络直报系统,实现了传染病信息及时、准确地报告。目前,系统已运行10多年,积累了大量随时间变化的疫情信息数据,这些数据往往蕴含着一定的内在规律性;采用合适的统计分析方法,挖掘这些数据随时间变化的规律,从而对未来的发展趋势进行预测,对传染病疫情的监测和防控具有极大的意义。乙肝是以肝脏炎症、肝功能受损为主要病变的多脏器损伤的传染性疾病,一直位居甲乙类传染病发病首位,严重威胁着公众的身体健康M。对乙肝发病情况进行预测,一方面可以根据预测数据针对性地开展防治工作,提高乙肝预防控制能力;另一方面根据预测数据95%置信区间,初步判断乙肝发病是否在惯常范围内波动,为其监测工作提供一定的参考£41。时间序列分析是一种仅需考虑对象本身的历史数据随时间发展变化的规律,并用该变量以往的数据资料建立统计模型,再进行外推预测的方法;它将各种影响因素都囊括在时间t里,以时间作为各种因素的综合替代因素,规避了回归分析等存在的影响因素资料无法获取的问题,因此在传染病发病情况预测中具有 较好的适用性Ul。ARTMA模型是时间序列分析方法中最常用的方法之一,它充分考虑丫序列的季节趋势和周期性,预测精度较高。但其存在2个主要的缺点:一是对样本量有要求,一般AR1MA模型至少需要50个以上的数据进行建模冰可以达到比较好的预测效果IZ1;二是ARIMA是一种短期预测模型,因此实际应用时需要不断纳入新的监测数据对模型进行修正,以更好地拟合预测模型,提高模型预测的精确度和敏感性,正确地反映疫情发展趋势本研究应用ARIMA模型对湖北省2005-2016年乙肝月发病数进行分析,样本量充足,通过识别、估计、检验、考核等过程建立了ARIMA(0,1,1)(0,1,1)12预测模型,采用该模型对2015年月发病数进行回代性预测,显示实际值均在预测值95%置信区间内,且实际值与预测值的平均绝对误差百分比较小,不足10%,说明利用ARIMA模型预测乙肝发病数精度较高U1;对2016年各月乙肝发病数进行前瞻性预测,结果显示所有月份的实际值均在预测值95%置信区间内,且与实际值的平均相对误差仅为3.94%;回代性和前瞻性预测均表明将ARIMA模型应用于乙肝发病趋势的短期预测是可行的。本研宄资料来源于传染病报告信息管理系统,在一定程度上保证了数据的质量,同时由于乙肝是慢性传染病,按发病tl期统计更能真实地反映乙肝的发病情况,因此本研究的数据具有一定的可信性。但是疫情报告质量容易受到多方面因素的影响,可能会对预测效果产生影响M。预测性分析本身是一种探索性分析,所建模型也并非一成不变,因此可将获取数据的影响因素作为自变量纳入模型进行深层次的探索和研究,以进一步提高模型的预测准确性。参考文献[1]肖枝洪,郭明月.时间序列分析与SAS应用[M].武汉:武汉大学出版社,2009:2-3.[2]王伶,姚文清.利用时间序列模型分析预测辽宁手足口病疫情趋势[J].中W卫生统计,2016,33(5):847-849.[3]余靓,梁丽君,黄平.广东地区肾综合征出血热流行特征与气象因素的ARIMA模型分析[J].中华疾病控制杂志,2016,20(8):851-855.[4]唐金芳,曾小云.2005-2014年南宁市麻疹发病率ARIMA模型及其趋势预测[J].中华疾病控制杂志,2016,20(7):738-740.[5]国家卫生计生委.传染病信息报告管理规范(2015版)[EB/OL].[2015-11-10]•http://www.nhfpc.gov.cn/jkj/s3577/201511/f5d2ab9a5c10448193998Ic92cbl8a54.shtml.[6]陈正利,陈伟,许汴利.应用ARIMA模型对河南省1991一2011年乙型肝炎发病趋势分析[J].中国卫生统计,2013,30(3):401-402. [1]陆波,闵红星,扈学琴,等.ARTMA模型在流感发病预测中的应用[J].中国实用医学,2014,9(8):269-270.[2]姬一兵,周脉耕,郭岩,等.2008年六省法定传染病报告质量调查分析[J].中华预防医学杂志,2010,44(6):562-564.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭