非参论文-Kruskal-Wallis秩和检验方法

非参论文-Kruskal-Wallis秩和检验方法

ID:42133248

大小:214.25 KB

页数:6页

时间:2019-09-08

非参论文-Kruskal-Wallis秩和检验方法_第1页
非参论文-Kruskal-Wallis秩和检验方法_第2页
非参论文-Kruskal-Wallis秩和检验方法_第3页
非参论文-Kruskal-Wallis秩和检验方法_第4页
非参论文-Kruskal-Wallis秩和检验方法_第5页
资源描述:

《非参论文-Kruskal-Wallis秩和检验方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、2010年中国各地区文盲率差异评析学院信息与计算科学学院—专业统计学班级小组成员设计时间摘要文盲率的高低不仅标志着一个国家文化教育普及和发达程度,而且也反映一个国家经济发展程度。在全国实施九年义务教冇的总趋势屮,地区教冇发展受政治、社会、经济、伦理、习俗等多种因素的影响,仍有明显差异,解释这种差异的程度以及趋势,对于实现我国可持续发展战略,缩小东、中、西部差距,具有深远意义。木文采用非参数统计屮的Kruskal-Wallis秩和检验方法,运用R软件,解释东、中、西部地区在2010年文盲人口及文盲率的差异,并对原因作出分析。关键词文盲率地区差异非参数检验引言传统文盲是指超过学龄期(

2、12-15岁以上)年龄既不会读又不会写字的人,文盲率指的是超过学龄期(12-15岁以上)年龄既不会读又不会写字的人在相应的人口中所占的比例。文盲率反映一个国家人们受教育的程度,文盲的标准,依一个国家经济条件和文化水平而定。多数国家规定只会读不会写者为文盲。在屮国,为了有计划地开展扫肓工作,把识字500个以上但未达到扫肓标准的人定为半文盲。文盲率指标除按总人口计算外,按地区分别计算也具冇重要意义,我国西部地区文盲率较高,其原因是由政治、社会、经济、伦理、习俗等多种因素造成的。文盲率的高低不仅标志着一个国家文化教育普及和发达程度,而且也反映一个国家经济发展程度。本文就我国文盲率的地理

3、区域差异作一探讨。本文将全国分为东、中、西部三个地区,來分析文肓率的东西部茅异。东部地区包括:辽宁、河北、山东、江苏、浙江、福建、广东、北京、天津、上海和海南11个省、自治区、纸辖市;屮部地区包括:吉林、黑龙江、内蒙古、山西、河南、安徽、江西、湖南、湖北9个省、口治区;西部地区包抓新鴉、廿肃、陕西、宁夏、四川、重庆、贵州、云南、广西、西藏、青海11个省、自治区、直辖市。为了保证研究的准确性,本文采用2011年出版的《中国统计年鉴》,对2010年屮国各地区文盲率加以对比分析。一、各地区文盲人口源数据由表1初步看出东部地区文肓率偏低,中部地区有几个省份文肓率较高,而西部地区总体偏高,

4、其中西藏甚至高达24.42%O表12010年我国各地区文盲人口及文盲率地区文盲人口(万人)文盲率(%)东部辽宁841.93河北1882.61ill东4764.97江苏3003.81浙江3065.62福建902.44广东2041.96北京331.70X津272.10上海632.74海南354.08中部吉林531.92黑龙江792.06内蒙古1014.07山西762.13河南3994.25安徽4978.34江西1393.13湖北2624.58湖南1752.67西部新疆522.36廿肃2228.69陕西1403.74宁夏396.22四川4385.44重庆1244.30贵州3048.74

5、云南2776.03广西1252.71西藏7324.42青海5810.23二、Kruskal-Wallis秩和检验分析过程1.基本原理设有k个连续型的随机变量总体:XI,X2,-Xkoxil,xi2,-xini是来自第i个总体Xi的样本,其容量为ni,i=l,2,-,ko总的样本容量为N=Ski=lni0假设这k个随机变量总体的形状相同,只可能存在位置参数的不同。引入检验统计量H=12N(N+l)SSBo其中SSB=Ski=lni[E(Ri)-E(R)]2=Ski=lni[E(Ri)-(N+l)/2]2。原假设HO:01=02=—0k;备择假设Hl:01,02,-Ok不全都相等。若

6、H的检验P值$0.05,不能拒绝原假设,即认为k个总体服从相同分布;若H的检验P值^0.05,拒绝原假设,即认为k个总体之间存在显著的差异性。对于木次研究,在给定显著性水平a=0.05检验东部、中部、西部三个地区的文盲率是否有显著差异。分析:(1)提岀假设H0:ul=u2=u3,备择假设Hl:不是所有的ui都相等,i=l、2、3°(2)检验统计*:H=12/N(N+1)SRi^2/ni-3(N+l),其中Ri表示第i个样本的秩和,Ni表示的是第i个样本的样本量,N表示的是三个样本的总样本量。(3)计算样本统计量H,并算出p值。1.操作源程序2.结果分析地区N(样本量)秩和期望秩值

7、东部1112611.45455中部912313.66667西部1124722.45455Kruskal-Wallis检验统计量:H二8.88563p值=0.01176278结果说明:东部、中部和西部的样本量分别为11、9、11,秩和分别为126、123、247,调整后三个样本的Kruskal-Wallis检验统计量为&88563,用自曲度为DF二3-1=2的卡方分布近似,得到大于卡方检验统计量6.4044的概率p二0.01176278<0.05,拒绝原假设,即说明三个地区的总体分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。