统计学原理贾俊平期末考试重点

统计学原理贾俊平期末考试重点

ID:39600245

大小:2.72 MB

页数:14页

时间:2019-07-07

统计学原理贾俊平期末考试重点_第1页
统计学原理贾俊平期末考试重点_第2页
统计学原理贾俊平期末考试重点_第3页
统计学原理贾俊平期末考试重点_第4页
统计学原理贾俊平期末考试重点_第5页
资源描述:

《统计学原理贾俊平期末考试重点》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。分析数据:分为描述统计方法和推断统计方法两种方法。描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计:是研究如何利用样本数据来推断总体特征的统计方法。推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,

2、其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitativedata)。数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitativedata)。(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据panaldata)。3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。在统计推断

3、中,通常是针对无限总体的,因而通常把总体看做随机变量(randomvariable)。统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(samplesize)。抽样的目的是根据样本提供的信息推断总体的特征。5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。样本统计量(statistic)是用来描

4、述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。16、变量(variable)是说明现象某种特征的概念,特点是从一次观察到下一次观察会呈现出差别或变化。例如:受教育程度,植株高度,年收入,宗教信仰,产品等级等都是变量。变量可以分为分类变量、顺序变量和数值型变量。数值型变量根据取值不同,可以分为离散变量(只能取可数值的变量,只能取有限个值,取值都是以整位数断开,如:产品产量、各位候选人得票数,企业数量等。)和连续变量(可以在一个或多个区间取任何值的变量,取值是连续不断的,不可一一列举,如:植株高度,毕业

5、生年收入,温度,零件尺寸误差等。)。变量也可以分为随机变量和非随机变量(抽取方法随机性不同),经验变量(empiricalvariable)和理论变量(theoreticalvariable)。经验变量描述的是周围环境中可以观察到的事物,理论变量则是统计学家采用数学方法构造出来的一些变量,比如z统计量、t统计量、χ2统计量、F统计量等都是理论变量。第二章数据的搜集本章小结1、数据的来源:直接来源与间接来源2、调查数据:概率抽样(简单随机抽样,分层抽样,系统抽样,整群抽样,多阶段抽样)和非概率抽样(方便抽样,判断抽

6、样,自愿样本,滚雪球抽样,配额抽样),搜集数据的方法(自填式,面访式,电话式)的抽样方式和特点3、实验数据:实验组和对照组,大量观察法4、数据的误差:抽样误差和非抽样误差(抽样框误差,回答误差,无回答误差,调查员误差,测量误差),误差的控制5、参数估计和假设检验所依据的主要是简单随机样本2第三章数据整理与显示1、直方图和条形图的区别:直方图用面积表示数据,条形图用高度表示数据;直方图主要展示数值型数据,具有连续性;条形图主要展示分类数据,分开排列。帕累托图:按照各类别数据出现的频数多少排序后绘制的条形图。2、累积

7、频数和累积频率(顺序数据统计量)累积频数(cumulativefrequencies):各类别频数或组的频数逐级累加起来得到的频数。频数累积方法有两种:向上累积(顺序数据从开始到最后,数值数据从小到大)和向下累积。累积频率(cumulativepercentages)或累计百分比:各有序类别或组的百分比逐级累加起来,也有向上累积和向下累积之分。3、数据分组有2种方法:单变量值分组和组距分组单变量值分组:把每一个变量作为一组,只适合离散变量,且在变量值较少的情况下使用。组距分组:全部变量划分为若干个区间,将一个区间

8、的变量值作为一组。A.适用于连续变量或变量值较多的情况B.一组的最小值称为下限(lowerlimit),一个组的最大值称为上限(upperlimit)。上限与下限的差称为组距,每组的中点值称为组中值(=(上限+下限)/2)。为了解决不重问题,习惯上规定“上组限不在内”,即a≤x<b。首组假定下限=该组上限-邻组组距末组假定上限=该组下限+邻组组距首组组中值的确定:如,20

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。