欢迎来到天天文库
浏览记录
ID:39116290
大小:555.19 KB
页数:5页
时间:2019-06-25
《地理加权回归模型在传染病空间分析中的应用_肖雄》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国卫生统计2013年12月第30卷第6期·833·*地理加权回归模型在传染病空间分析中的应用122111△肖雄杨长虹谭柯何红燕张韬李晓松【提要】目的探索地理加权回归模型(GWR)在四川省血吸虫病空间分析中的适用性,为传染病的防控提供方法学参考。方法以2001年四川省血吸虫病流行病调查数据为例,结合相关的社会经济学数据以及自然环境数据,采用GWR模型分析血吸虫病血检阳性率与社会经济学因素、自然环境的关系,并同经典的全局最小二乘法(OLS)进行比较。结果影响血吸虫病血检阳性率空间分布的变量有:人口密度、降雨量和归一化差异植被指数(NDVI)。比较两种模型的222主要诊断指标,GWR模型的AIC、
2、σ、R和校正R全面优于OLS。结论GWR模型较OLS能更加深刻地揭示传染病数据中的复杂空间关系,在传染病空间分析中具有一定的应用前景。【关键词】地理加权回归模型传染病空间分析空间异质性血吸虫病〔6〕传染病在特定地理环境中的发生是其自身流行病的血吸虫。日本血吸虫及其中间宿主钉螺的生活学机制与环境因素相互作用的结果。这种相互作用使史与环境因素的关系都极为密切,因此血吸虫也是最得传染病的发生在地理区域上具有一定的变异,表现早适用空间分析技术的传染病之一。本文拟以2001为不同区域发病率存在差异,而邻近区域发病水平具年四川省血吸虫病流行病调查数据为例,结合相关的〔1〕有相似性。环境因素主要体现在数据的
3、空间属性社会经济学数据以及自然环境数据,采用GWR模型上。据估计,80%的传染病流行病学研究资料都具有分析血吸虫病血检阳性率与社会经济学因素、自然环〔2-3〕空间属性。如果忽略传染病数据的空间属性,不境的关系,并同经典的OLS进行比较。进而,探索但可能会导致对传染病传播流行规律的错误认识,还GWR模型在传染病空间分析中的适用性,为传染病的会造成对传染病空间信息的极大浪费。防控提供方法学参考。空间异质性(spatialheterogeneity)或空间非平稳资料与方法性(spatialnonstationarity),即变量间的关系或结构会随着地理位置的变化而改变,是空间分析中一个普遍1.数据来
4、源存在的现象。基于经典统计学理论的最小二乘法(or-传染病数据来源于2001年全国血吸虫病的流行dinaryleastsquares,OLS),由于其具备完备的理论体病调查,筛选出四川省作为本次的研究数据。选取的系和统计推断方法,曾被广泛应用于空间数据分析。分析指标为血吸虫病血检阳性率,其计算公式为:血检但经典的回归模型要求数据服从独立同分布,在分析阳性率=血检阳性人数/血检人数;研究的空间尺度为之前就假定变量间关系具有空间一致性而掩盖了其局乡镇(街道),因地理数据在乡镇级别上的信息缺失,〔4〕部特性。在总结前人对可变参数和局部回归的研在进行地理位置标准代码的替换中丢失了239个,在究的基础上
5、,Fotheringham等人于1996年提出了一种余下的605个乡镇中,107个乡镇的血检人数为零。用于解决空间异质性问题的新方法———地理加权回归因此,最终纳入本研究的流行乡镇数为498个。该传模型(geographicallyweightedregression,GWR)。经过染病数据由四川省疾病预防控制中心提供。数十年的发展,GWR模型及其拓展模型近年来在国内结合历史文献并考虑到数据的可获得性,本次研的应用越来越广泛。对于该方法的应用,国内目前主究选取的社会经济学因素包括城市化率、人口密度和要还是集中在计量经济学领域,在卫生领域尤其是在人均GDP,数据来源于《四川统计年鉴2002》;自
6、然环传染病防控中的应用,国内相关文献还相对较少。境因素包括气温、高程(DEM)、归一化差异植被指数血吸虫病(schistosomiasis)是由于人或牛、羊、猪(NDVI)和降雨量,环境气候数据来源于MODIS;四川等哺乳动物感染了血吸虫而引起的一种具有传染性、省各乡镇的中心坐标、边界及乡镇标准代码均来源于〔5〕地方性和自然疫源性的人、畜、兽共患寄生虫病。“2009年四川省乡镇街道地图”。我国为日本血吸虫流行区,这几乎也是我国唯一流行2.方法原理(1)GWR基本模型*基金项目:卫生公益性行业科研专项经费项目(200802133)GWR模型是对OLS的扩展。在GWR模型中,特1.四川大学华西公共
7、卫生学院卫生统计学教研室(610041)定区域的回归系数不再是利用全局信息估计的统一单2.四川省疾病预防控制中心〔7〕△通信作者:李晓松,E-mail:lixiaosong1011@126.com值,而是随空间地理位置i而变化的可变系数,GWR·834·ChineseJournalofHealthStatistics,Dec2013,Vol.30,No.6模型可以表示为以下形式:带宽的方法有:交叉
此文档下载收益归作者所有