权数问题处理方法和技术.pptx

权数问题处理方法和技术.pptx

ID:68043155

大小:218.98 KB

页数:38页

时间:2021-09-29

权数问题处理方法和技术.pptx_第1页
权数问题处理方法和技术.pptx_第2页
权数问题处理方法和技术.pptx_第3页
权数问题处理方法和技术.pptx_第4页
权数问题处理方法和技术.pptx_第5页
权数问题处理方法和技术.pptx_第6页
权数问题处理方法和技术.pptx_第7页
权数问题处理方法和技术.pptx_第8页
权数问题处理方法和技术.pptx_第9页
权数问题处理方法和技术.pptx_第10页
资源描述:

《权数问题处理方法和技术.pptx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、抽样调查中的权数问题一.权数的功能定义:以某种数量形式、权衡被评价事物总体中诸因素相对重要程度的量值;抽样中的权数:在样本对总体推断中用以衡量各样本单元的变量值在总体中用大小的数值。作用:通过权数使样本还原到总体,即样本单元权数之和等于总体单元数。具体看,权数功能表现在两个方面:由样本还原总体。这是侧重数量,主要体现在不等概抽样设计中,样本单元入样概率不同,权数就不同;2.调整样本结构。由于抽样的随机性,样本结构与总体结构不一致,而结构又与目标量有关。权数的两个功能,有时可以达到一致,有时可能存在矛盾。一般而言,首先保证

2、目标1,在目标1基础上实现目标2。一般,目标1通过计算样本单元设计权数实现;目标2通过对设计权数的事后分层调整体现。二.计算权数步骤设计权数表现为样本入样概率的倒数,概率抽样特征是每个样本单元入样概率是可以计算的。抽样框信息是计算权数的重要依据,能否计算出权数也是概率抽样和非概率抽样的根本区别。如采用二阶段抽样,设计权数计算出设计权数后,还需根据调查中出现的不同问题进行调整,否则无法实现样本单元权数之和等于总体规模。调整内容1,特殊因素调整,主要对调查实施中出现与设计不符情况的调整。以整群抽样为例:整群抽样设计群规模(调

3、查小区)为30(M)户,若调查小区的住户,则应该计算调整系数,使实际样本回归到原设计。调整系数:调整内容2,无回答调整调整方法是计算无回答调整因子。若令:第j调查小区的无回答调整因子;:第j个调查小区的回答住户的权数和;:第j个调查小区的无回答住户的权数和;则第j调查小区的无回答调整因子为:无回答调整的本质是将无回答样本单元的权数分解到回答单元身上。所以,调整应该在分类、分层基础上进行。设计最终权数由此实现目标1,样本单元权数之和等于总体规模。对于目标2,结构方面的权数调整,目的是使样本结构与总体结构一致。由于抽样的随机

4、性,样本结构与总体结构可能出现不一致。如:调查教师平均工资,工资水平与职称有关。样本职称结构与总体不一致。基本做法,进行事后分层,利用总体辅助信息进行调整。多变量联合调整是经常遇到的问题。如教师工资不仅与职称有关,还与性别有关。按职称与按性别事后加权最终计算结果可能不同。这时权数调整将趋于复杂。调整方法很多,有许多文献进行过这方面的讨论,如迭代,校准(Calibration),广义回归等。以迭代为例:迭代调整的核心是使样本联合分布与总体联合分布一致。从辅助变量的边缘分布考虑,沿行列方向交替迭代,直至收敛。例中有两个进行加

5、权调整的辅助变量A、B。其中A有4类,B有3类。原始加权的样本联合分布和总体联合分布如下表所示。表1基于辅助变量A和B的原始加权的样本联合分布表2基于辅助变量A和B的原始加权的总体联合分布现实中,表2格中数字可能未知,但有边缘分布即可。B1B2B3TotalA1204040100A250140310500A31005050200A43010070200Total2003304701000B1B2B3TotalA1804055175A260150340550A317060200430A455165125345Total36

6、54157201500第一步是对所有行进行调整,即将A1行上所有单元乘以175/100,A2行上所有单元乘以550/500……,第二步是对所有列进行调整,即在第一步所得结果的基础上,将B1列上所有单元乘以365/356.75,将B2列上所有单元乘以415/504,将B3列上所有单元乘以720/639.25。表3迭代第一步表4迭代第二步B1B2B3TotalA135.8157.6478.84172.29A256.27126.81384.08567.16A3219.9788.52121.08429.57A452.95142.

7、04136.00330.99Total365.00415.00720.001500.00B1B2B3TotalA135.0070.0070.00175.00A255.00154.00341.00550.00A3215.00107.50107.50430.00A451.75172.50120.75345.00Total356.75504.00639.251500.00调整过后,样本每行总量与总体相应行总量又不一致了,因此这样的迭代过程要一直重复直到行与列总量收敛于总体边际分布。最终的结果如下表5所示。表5最终迭代调整系数B

8、1B2B3A11.811.452.02A21.080.871.21A32.201.762.45A41.831.452.04三.权数的影响与控制(一).权数的影响权数是双刃剑,进行调整有助于样本结构和总体结构一致,但权数之间差异过大有可能增大估计量方差。为了说明这点,有下面论证记:为样本的简单平均数;为样本的加权平均数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。