欢迎来到天天文库
浏览记录
ID:44129104
大小:445.78 KB
页数:10页
时间:2019-10-18
《统计学重点整理[教学]》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、参数(parameter):描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主耍有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示统计fi(statistic):用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计虽冇样本均值(x)、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母表示1、概率抽样:简单随机抽样(SRS)、系统抽样(SYS)、分层抽样(STS)、整群抽样(STS)、多阶段抽(MSS)简单随机抽样(SRS)特点:总体中每一个样木点均有相同机率被抽中、
2、抽出某个样本后不影响另一个样本抽岀的机率(独立性)、经常先列样本名册后用计算机产牛随机数或随机表抽选放回和不放冋:放回(重复)抽样;无放回(不重复)抽样系统抽样(SYS)等距抽样:将所有样本列册以序号排列,先随机抽取第一个样本,接着每隔K个样本抽取下一个样本;间隔K的求法:Populationsize/Samplesize;常用于电话抽样(类似于简单随机抽样)分层抽样(STS)将总体区分为数个层(strata):层之间互斥且周延、层内性质相近、层与层之间差异明显从每一层中简单随机抽取若干样本作为该层的代表,再将所有层总结集合整群抽样(STS)将总体区分为多个样集
3、clusters:群集间互斥且周延、群集与群集间差异小、样集内类似总体随机抽取数个clusters将抽中的群集内每个样本均调查多阶段抽样(MSS)第一阶段:分群——整样抽样第二阶段:分层——分层抽样第三阶段……整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同祥Z间的差异较人,由此而引起的抽样误怎往往大于简单随机抽样。抽样方法优点缺点简单随机抽样操作简便易行,总体个数多时,工作量太大系统抽样操作便简易行,可以提高效率如不了解样本总体,抽出的样本有偏差分层抽样充分保证样本结构与总体的一致整体差异不明显时不适用,在使用时提高样本的代表性需要与其他抽样方
4、法综合使用。2、抽样所产牛.的误差:抽样误差(samplingerror)和非抽样误差(non-samplingerror)抽样误差(理论上不可避免):由于抽样的随机性所带來的误差(偶然性)所有样本可能的结果与总体真值之间的平均性差异影响抽样误差大小的因索:样本量的大小、总体的变异性普杳无抽样谋差,但是普查误差可能比抽样误差大非抽样误差:除抽样误差之外的,山于英他原因造成的样本观察结果与总体真值之间的差界存在于所有的调杳之屮:概率抽样,非概率抽样,全面性调杳包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差冋答谋差:理解谋差、记忆误差、有意识误差无回答
5、课差:应答率的问题:酒吧打架致死事件,90%是被打死的那个人先动手的误差的控制抽样误差可计算和控制非抽样误差的控制:合理选样抽样框、改良问卷、调杳过程控制(调查结果进行检验、评估;现场调杳人员进行奖惩的制度)茎叶图Stem-and-leafplotforYEAR(结婚年龄)(唯一一个没有丢失原始数据的统计表)3、画表的一般原则:合理安排统计表的结构、总标题内容应满足3W要求、数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明、表屮的上下两条横线-•般用粗线,其他线用细线、通常情况下,统计表的左右两边不封口、表中的数据一般是右对齐,冇
6、小数点时应以小数点对齐,而月•小数点的位数应统一、对于没冇数字的表格单元,一般用"一”表示、必要时可在表的下方加上注释4、集中趋势表示:均值、中位数、众数、几何平均数众数:出现次数最多的变最值不受极端值的影响、一组数据町能没冇众数或冇几个众数、主要川于定性数据,也可川于定量数据未分组数据:无众数(原始数据:1234567)、一个众数(原始数据:1233345)、多于一个众数(原始数据:1233445,此时众数为二者平均3.5)分组数据:先在次数表中找出次数最多的那一组,称为「众数组」,一般以Mo来表示。若取众数组的组中点为众数,则称为粗众数。Czuber插补法—
7、二5——xCA1■*"A2中位数(median):将一组数字山大排至小,位居中间的数值为该组数字的中位数。一般以Me来表示马內诙姐ET69中位效折在组豹组眩各观察值与中位数差异的绝对值总和为最小。以下列公式求出中位数:均值(mean):集中趋势的最常用测度值、一组数据的均衡点所在事实上,各个观察值与平均数差的总和为0、各个观察值与平均数差的平方和为最小几何平均数(geometricmean):n个变量值乘积的n次方根数据必须为正值才能计算儿何平均数主要用于计算平均百分比(percentages)比率(ratios)、指数(indexes)>成长率(growthr
8、ates)的计算分位数:
此文档下载收益归作者所有