欢迎来到天天文库
浏览记录
ID:14406981
大小:66.50 KB
页数:13页
时间:2018-07-28
《统计学(贾俊平版)重点》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。数据1.分类数据对事物进行分类的结果数据,表现为类别,用文字来表述.例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的.无限总体所包括的元素是无限的,不可数
2、的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。有总体均值(m)、标准差(σ)总体比例(π)统计量:描述样本特征。样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。再一个是实验。概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽
3、取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后
4、对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取
5、的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。概率抽样与非概率抽样的比较1.概率抽样–依据随机原则抽选样本–样本统计量的理论分布存在–可根据调查的结果推断总体2.非概率抽样–不是依据随机原则抽选样本–样本统计量的分布是不确定的无法使用样本的结果推断总体数据收集的
6、方法:自填式,面访式,电话式数据误差:抽样误差(样本量的大小),非抽样误差。误差的控制统计数据的质量要求1.精度:最低的抽样误差或随机误差2.准确性:最小的非抽样误差或偏差3.关联性:满足用户决策、管理和研究的需要4.及时性:在最短的时间里取得并公布数据5.一致性:保持时间序列的可比性6.最低成本:以最经济的方式取得数据第三章数据审核(完整性和准确性)数据筛选(符合特定条件)数据排序(那一定顺序)数据透视(按需要汇总)频数(frequency):落在各类别中的数据个数比例(proportion):某一类别数据占全部数据的比值百分
7、比(percentage):将对比的基数作为100而计算的比值比率(ratio):不同类别数值的比值条形图:用宽度相同的条形的高度或长短来表示各类别数据的图形。有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布,绘制时,条形图可以横置或纵置,纵置时也称为柱形图。帕累托图:按类别数据出现的频数多少排序后绘制的条形图饼图:也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用组距分组:将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较
8、多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组分组数据:直方图(用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图),折
此文档下载收益归作者所有