欢迎来到天天文库
浏览记录
ID:25599274
大小:56.00 KB
页数:9页
时间:2018-11-21
《宏观经济统计数据质量的benford评价及实证研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、宏观经济统计数据质量的Benford评价及实证研究宏观经济统计数据质量的Benford评价及实证研究一、引言 随着近年来国民经济的快速发展,我国经济实力与国际综合影响力不断提高,我国宏观经济统计数据质量引起了世界关注,国内外相关机构及学者对宏观经济统计的准确性问题进行了大量研究。本文引入Benford法则进行宏观经济数量质量的评价。实践证明,应用Benford法则,其在数据质量评价应用中存在着成本较低,稳健性良好等优势。在分析Benford法则及其检验方法的基础上,探究其在宏观经济统计数据质量的实
2、证研究。 二、Benford法则及其检验方法认知 (一)Benford法则的基本认知 Benford法则是以物理学家FrankBenford名字所命名的一种数值规律,其法则认为,人们进行数据处理时,其将较小数字作为首位数字的数据的频率相对较高。其通过长时间的数据收集与分析,对其规律进行了论证,即Benford定律,又被称之为首位数法则。通过研究与推导,Benford依据其定律获得以下数学表达式: p(d1)=lg(1+■)d1=1,2,3,9 在上式中,p(d1)代表的是以d1作为首位数字
3、所出现的频率参数,首位数字,指的是数据集中数字左侧的第一位数字,其数字应非零非负,确保其数据有效性。其公式即Benford法则表达式。 Benford法则的出现,为进行大量数据的数字分布状况预测提供了理论支持。然而该方法在最初阶段缺乏对该现象的合理解释与证明,随着学者进一步的研究与论证,对该法则应用的范围与影响因素进行了明确,如要求数据具备一定规模性,数据形成不执行认为直接赋值,数据不应为按照规律排列的数据集等。 (二)Benford法则在宏观经济数据质量中检测的方法 国内外大量实证性研究表明
4、,应用Benford法则可以进行数据集中的舞弊行为有效检测,将目标数据所具备的实际数字分布规律与Benford法则条件下的标准分布规律进行对比,获取评估结果,判断其实际数据分布规律是否存在不合理现象。如存在,则说明数据统计存在着人为因素证明数据集可靠性较差。Benford本文由.L.收集整理法则进行数据检验,其本质上属于一种对比检验方法,具体的流程为:第一,选定宏观经济指标,进行电子数据采集,其宏观经济指标应具备代表性;第二,对所收集的数据集是否符合Benford法则进行判断,选择一定的目标字段,B
5、enford法则其数据集适应条件为:数据信息其来源不同,采取随机抽样方式形成统计数据;第三,针对选中目标字段,将统计数据进行一定处理,如数据中存在的负值可以取其绝对值,针对首位为0的数据则可以通过数据扩大来提取数字;第四,进行数据异常分析。将所选择的数据集之中的数据首位进行分离,进行数据首位19各个数字所出现的频率与分布规律进行描述,将其分布规律与Benford法则条件下的分布规律进行对比,计算出其数据分布偏差参数,将所选数据第二位进行分离,采取通道方式进行数字频率统计与分布规模描述,循环操作并观察
6、数据是否存在异常,以上操作可通过统计软件来实现;第五,依据统计结果与数字分布偏差研究,对数据可靠性进行判断,针对不可靠数据应找出原因,给出结论。 三、宏观经济统计数据质量的Benford法则评价及实证研究 在Benford法则进行宏观经济统计数据准确性实证研究中,选择两个视角进行分析,其一,对我国成立后四个经济部门的主要宏观经济指标数值执行分析,时间阶段选择1949年2008年期间,采取Benford法则对其经济指标可靠性进行分析。综合数值取值可靠性,以分段形式进行纵向研究,进而获得宏观经济统计
7、数据质量状况。其二,从区域视角进行研究,即以我国主要省份宏观经济指标总量进行数据可靠性分析。 (一)我国历年来宏观经济统计数据所具备的可靠性研究 1.宏观经济指标选择。在本研究中,以国民经济核算统计、政府财政统计、金融业与国际收支平衡四个部门为研究对象,选择主要的经济变量,指标选择中需要考虑指标的全面性、代表性与数据可获取性。如在民国经济核算部门,其指标选择以国内生产总值、居民消费水平、固定资本总额。支付消费支出及股票筹资额等指标;政府财政统计部门中则选择国家财政收入、国家财政支出、预算外资金收
8、入及支出总额、国家外债余额等指标;金融业部门则选择现金收入与现金支出、信贷资金总额、流通现金四个指标,国际收支平衡部门则选择经常项目差额、金融项目差额、储备资产增减额及净误差、资本往来项目差额、储备资产遗漏等为统计指标。 考虑到我们建国后不同经济体制的差异,有些项目指标在当时并不存在,为此选择相近指标作为补充。如固定资本形成总额指标,在1978年之前,我国采取的是固定资产积累额等。在实证研究中,以19502008年为时间段,选取指标数据作为数据集,其数据来源为各年《
此文档下载收益归作者所有