资源描述:
《基于时间序列的疫情预测模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、14第12期NO.12宜宾学院学报JournalofYibinUniversityDecewber.2005基于时间序列的疫情预测模型12周继红,张森(1.资中县一中,四川资中641200;21宜宾学院数学系,四川宜宾644000)摘要:以北京2003年SARS疫情统计为背景,对疫情时间序列进行分析和识别,建立了非线性时间序列模型来预测SARS病人变化数,通过仿真试验与实际对比验证,表明该预测方法是十分可靠的。关键词:时间序列;模式识别;预测;数学模型中图分类号:O211.61文献标识码:A文章编号:1671-5365(2005)12-0014-022003年的全国数学建模竞赛A题是
2、以“北京2003年SARS疫情统计”断它属于何种形式的时间序列。一般地,对于一个时间序列的形式通常为背景,要求建立疫情预测模型。在公开报道的竞赛论文中,还没有见到作如下方面的识别:用时间序列分析方法建立预测模型的论文。时间预测分析,适用于任何1.2.1随机特性的识别一种单目标分析和预测,但是它的可用程度要根据具体的应用情况进行当时间序列和样本数n很大,且所有自相关系数R1,R2等都近似等识别和选择。时间序列预测一般要根据预测目标的要求,调查有关情况于0,则说明该序列各期数值之间不存在任何相关关系,即该序列完全是数据,然后将原始时序加工整理成为预测信息。由随机数组成。1时间序列特征识别
3、与模式识别这里由表1可以看出,前5个相关系数均大于0.5,所以此序列为非1.1时间序列特征识别随机序列。A)累计统计图另外,也可以根据G.E.Box.和D.A.Pierec提出的检验法,判断出自根据2003年北京公布的前期确诊SARS病人数目(病人数据略),绘相关系数R与0有显著差异,这样也可判定该序列不是随机性时间序列。制时间序列累计统计图,就可大致判断病人数的变化趋势:1.2.2趋势特性的识别SARS病人总数呈非线性变化趋势(见图1)如果时间序列的自相关系数R1,R2,⋯⋯逐渐减小,且其中有相当多个大于1.96/n,即与0有显著差异,则可以认为时间序列具有趋势性(该序列样本n=6
4、5)。95%置信区间为±1.96/65=±0.2097这里计算的前9个相关系数,均大于0.2097;并且R1=0.9106比0.2097大得多。根据趋势性判断,可认为该序列具有明显的趋势性。2时间序列法建模与求解通过对北京SARS病例时间序列进行识别,认为它是一种确定型时间序列。对于确定型时间序列,通常可采用“平滑法”进行处理,平滑法是一图1北京SARS病人累计统计图种简单而有效的预测手段。根据前面的分析,可以建立预测SARS病人的B)自相关系数非线性时间初步模型。但经过分析发现,SARS疑似病人数对模型影响不除了用图形对时间序列进行特征识别外,还可用时间序列的自相关容小视。特别是当
5、政府对疫情采取一系列的控制措施后,对初始建立的系数进行识别。时间序列自相关的理论依据是:同一变量在不同时期的模型影响极大,所以我们对原有模型进行了修整和完善,使其更符合取值之间存在着一定的联系。自相关系数能够较灵敏的反映出各序列相SARS疫情的实际传播情形。互关系的密切程度,因而可用于识别时间序列的特征。〔1〕〔1〕xt=ρxt+(1-ρ)xt-1+ks(1)这里样本数量为65(北京报告病例时间(天)),序列前10个自相关系〔1〕〔1〕〔2〕xt=ρxt+(1-ρ)xt-1+ks(2)数见表1。〔3〕〔2〕〔3〕xt=ρxt+(1-ρ)xt-1+ks(3)表1自相关系数列表2Yt+1
6、=at+btl+ctl(4)R1R2R3R4R5R6R7R8R9R10〔1〕〔2〕〔3〕其中:xt,xt,xt是关于时间序列的三次平滑值;k控制系数;s0.91060.82580.74200.65980.57690.49570.41740.34400.27180.2076疑似病人数;ρ加权系数;at,bt,ct为平滑系数;Yt+1为预测值;l为时间1.2模式识别步长变量(单位:天)。分析时间序列的特征后,通常应采用相应的方法进行模式识别,即判加权系数ρ是新旧数据在平滑中的分配比值。从实际上看,病人的收稿日期:2005-04-30作者简介:周继红(1963-),男,四川资中县人,理学学
7、士,中学一级,主要从事高中数学研究。2005年12期周继红:基于时间序列的疫情预测模型15增加数量的确充分依赖最近的病人数量,特别在控制前,这种关系很明结果分析:一步预测的误差均方根为0.5853,表明预测第2天的误差显,所以这里权系数ρ确定为序列的最大自相关系数:0.9106。平均不超过1人三步预测(后20天)的误差均方根为3.437,表明预测第四求解时,将平滑差作为时间滞后量,采用“差分法”对上述三次平滑值天的误差也不超过4人。以上分析和图示可以看出: