基于benford法则的gdp数据可靠性分析

基于benford法则的gdp数据可靠性分析

ID:10062899

大小:29.50 KB

页数:8页

时间:2018-05-23

基于benford法则的gdp数据可靠性分析_第1页
基于benford法则的gdp数据可靠性分析_第2页
基于benford法则的gdp数据可靠性分析_第3页
基于benford法则的gdp数据可靠性分析_第4页
基于benford法则的gdp数据可靠性分析_第5页
资源描述:

《基于benford法则的gdp数据可靠性分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Benford法则的GDP数据可靠性分析摘要:本文利用Benford定律并结合统计检验的方法,以四川省GDP相关数据为例,对我国地区统计数据质量的可靠性进行了研究。关键词:Benford法则GDP数据可靠性1统计数据质量及可靠性的界定质量是一个哲学概念,它是一个多维的立体的概念,具有相对性。随着人们质量观念的变化,人们逐步认识到质量不仅包括产品的使用性能,还包括需求客户对产品的满足程度,它成了一个内涵丰富的综合性概念。不同社会组织机构、不同用户、不同时期会有不同的质量标准和要求。同样,统计数据作为统

2、计工作的产品,对统计数据质量内涵的认识也逐渐发生了变化。过去认为统计数据质量就是统计数据的准确性,即统计数值与目标特征真实数值的接近程度或一致程度。而现在对统计数据质量的理解则由过去的单标准变成多标准、多层次的综合概念,具体要求的标准更多了,比如要求准确、适用、及时、可比、可取和客观等多具体标准。8可靠性是一个数理概念,是质量范畴的小概念,主要用来刻画统计数据质量标准之一的统计数据准确性的标尺,也就是对实际数据与真值之间的误差进行评估。评估数据质量可靠性的方法有很多,如经验分布检验、统计指标之间的逻辑检

3、验、相对指标的相关分析、计量模型评价等。2Benford定律我们知道,在社会经济统计领域很多统计总体的个体标志值在理论上服从某一特定的统计分布。鉴于此,通过对统计总体中的各个个体标志值进行特定的统计分布检验,可以初步判断出各个个体的标志值是否正常、可信。为此,笔者选择了Benford定律对四川省GDP相关数据进行可靠性检验。Benford定律是自然数字的一种内在规律,其含义是指假设在样本空间足够大的情况下,第一位数字为1到9之间的数字发生的概率具有一定规律,越小的数字出现的比率越高,其中1为第一位数字出

4、现的概率达0.3,2为第一位数字出现的概率为0.17-0.19,以此类推,8或9为第一数字出现的概念仅有0.05左右。该定律的主要奠基人FrankBenford对人口出生率、死亡率、物理和化学常数、素数数字等各种现象进行统计分析后发现,由度量单位制获得的数据都符合Benford定律,即自然数1到9的使用频率,公式为:F(d)=log[1+[1/d]]d=1,2,3……,98应该指出的是,利用Benford定律必须保证研究的数据无序且未人为修饰。该定律不但适用于第一位数字,也可用于第二位、第三位数字。在采

5、用Benford定律,由公式计算得到的各位数字的标准分布概率,如表1结果所示:表1Benford定律的各位数字的标准分布概率表■此外,Benford定律也遵从大数法则和中心极限定理,基于文章篇幅的原因,这里就不一一证明。3基于Benford定律的四川省GDP统计数据实证分析考虑到Benford定律在应用时候遵从的条件,如果我们所研究的数据样本存在人为加工处理,则该数据样本不符合该定律。所以对数据样本进行质量评估过程中,利用Benford定律进行分析,来检验数据的真实与否,是可信的。国内研究对Benfor

6、d定律的应用主要集中在财务审计对上市公司的研究领域,很少有利用其对地区统计数据质量做实证研究分析。为此,本文选取了四川省1978-2011年的地区生产总值相关数据进行检验,判断四川统计数据质量是否可靠。3.1建立假设假设四川省地区生产总值是可信的,根据Benford定律,GDP数据的前两位数的数字分布情况应该与Benford定律下的数字分布情况相同。为此,我们建立两个假设:针对?字2检验,从整体出发,提出如下两个假设:H1:四川省GDP数据的第一位数的出现次数与Benford定律下的随机分布相一致;8H

7、2:四川省GDP数据的第二位数的出现次数与Benford定律下的随机分布相一致。针对Z检验,从具体每个数字出现频率的期望值出发,提出如下两个假设:H3:四川省GDP数据的第一位数中每个自然数(1,2,3,……,9)出现频率与Benford法则下的频率相一致;H4:四川省GDP数据的第二位数中每个自然数(0,1,2,3,……,9)出现频率与Benford法则下的频率相一致。3.2数据说明为了研究的深入,本文在考虑四川省GDP相关数据基础上,将四川省地区生产总值数据细分为第一、二、三产业三部分,并把同时期的

8、人均地区生产总值数据纳入。数据均为历年四川省统计年鉴整理,具体数据略。所采用的研究方法是用Excel软件分别统计1978年-2011年四川省地区生产总值相关数据第一位数1至9这九个自然数和第二位数0至9这十个自然数出现的次数,并进行?字2检验和Z统计检验。3.3检验统计量8通过?字2拟合优度来评估出现的每个自然数出现的观测值和期望值之间的概率分布的拟合程度,以此来佐证四川省地区生产总值样本数据大小和总体上存在偏差;采用Z统计来评估各个自然数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。