资源描述:
《一种调查敏感性问题的随机化方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷第3期大学数学Vol.24,№.32008年6月COLLEGEMATHEMATICSJun.2008一种调查敏感性问题的随机化方法徐春梅,吕恕(电子科技大学应用数学学院,成都610054)[摘要]根据已有的调查定性敏感性问题的方法,本文提出了一种新的随机化调查方法,该方法得到的估计量在一定条件下具有较小的方差.[关键词]敏感性问题;随机化回答;相对效率[中图分类号]O212[文献标识码]C[文章编号]167221454(2008)03201322041前言在当今的社会经济等各项统计调查中,经常会遇到各种各样的敏感性问题.所谓敏感性问题,是指与[1]个人或单位的隐私或私人
2、利益有关而不便于向外界透露的问题.比如,个人或单位是否偷税漏税及数额的多少;是否吸毒、赌博等.对于这类敏感性问题,调查中若采用直接问答的方式,被调查者为了保护自己的隐私或出于其他的目的,往往会拒绝回答或故意做出错误的回答.为了得到敏感性问题的可靠的样本数据,同时使被调查者没有后顾之忧地给出真实回答,又保护个人隐私,有必要采用随机化回答方法.随机化回答方法,是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题.这一技[2]术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任.1965年Warner提出了随机化回答调查法,发展至今,已出现了多种调查
3、敏感性问题的随机化回答方法,比如Simmons模型、[3]Greenberg模型以及改进的模型.本文根据无关问题模型,作了适当的修改,得到了改进的方法,在一定条件下,新方法得到的估计量具有较小的方差.2模型介绍设总体分为互不相容的两类:具有敏感性特征的一类A与不具有敏感性特征的一类珚A,我们调查的目的是估计具有敏感性特征(属于A)的人在总体中所占的比例πA.设Y是与A无关的非敏感性问题(比如你喜欢绿色吗?).模型的基本设计为:制作一个能产生三种结果的随机化装置,如三套外形一样的卡片,1号卡片上写有敏感性问题“你属于A吗?”(比如你在考试中作弊了吗?),2号卡片上写有敏感性问题的
4、对立面“你不属于A吗?”,3号卡片上写有无关的问题“你属于Y吗?”1号、2号与3号卡片出现的概率为[4]p1,p2,p3(p1+p2+p3=1)假设所有被调查者的回答都是真实的,样本容量为n.令1,若被调查者回答“是”,Xi=i=1,2,⋯,n,0,若被调查者回答“否”,P(Xi=1)=p1πA+p2(1-πA)+p3πY,P(Xi=0)=p1(1-πA)+p2πA+p3(1-πY),θ1是n个被调查者中回答“是”的比例.按矩估计方法,令[收稿日期]2006203212第3期徐春梅,等:一种调查敏感性问题的随机化方法133θ1=p1πA+p2(1-πA)+p3πY.于是得到πA
5、的一个无偏估计量θ^1-p3πY-p2π^A=(p1≠p2),p1-p2其中θ^1是调查结果中回答“是”的比例θ,^1是θ1的无偏估计量.当πY未知时,需要用第二组样本直接估计π[5]Y,在一定条件下,方差达到最小.最小的方差为2[θ1(1-θ1)+p3πY(1-πY)]V0(π^A)=2.n(p1-p2)3改进的模型设敏感性问题为A,非敏感性问题为Yi(i=1,2,且πY未知,假定A与Y1,Y2均不相关),样本容量为in,分为n1和n2两个子样本.在样本i(i=1,2)中,回答的规则如下:在第一阶段,以比例p1,p2,p3(p1+p2+p3=1)混合红、白、蓝三种小球.若被调
6、查者抽到红色小球,回答“你属于A吗?”;若抽到白色小球,回答“你不属于A吗?”;若抽到蓝色小球,回答“你属于Yi吗?”.在第二阶段,被调查者直接回答无关的非敏感性问题Yj(j≠i,j=1,2).以上操作都是在调查者不在场的情况下进行的,有效地保护了被调查者的隐私.令θir表示第i个样本中被调查者在第一阶段回答“是”的比例;θid表示第i个样本中被调查者在第二阶段回答“是”的比例;θird表示第i个样本中被调查者两次都回答“是”的比例,则有θir=p1πA+p2(1-πA)+p3πY,θid=πY,θird=p1πAY+p2π珚AY+p3πYY,ijjjij其中πAY表示被调查者
7、同时属于A与Yj的比例,π珚AY,πYY的意义类似定义,πA表示具有敏感性特征A的jjij人在总体中所占的比例,πY表示具有属性Yi的人在总体中所占的比例.可以得到第i个样本的πA的无偏i估计量π^A(i)θ^ir-p3π^Y-p2iπ^A(i)=(其中p1≠p2,i=1,2),p1-p2式中π^Y=θ^jd(i≠j,i,j=1,2)θ,^ir和π^Y分别是θir和πY的估计量θ,^ir和π^Y的值由调查结果确定.iiii设0<ω<1,则总体中πA的无偏估计量为π^A=ωπ^A(1)+(1-