统计学复习资料(名词解释、简答)

统计学复习资料(名词解释、简答)

ID:40007799

大小:42.50 KB

页数:4页

时间:2019-07-17

统计学复习资料(名词解释、简答)_第1页
统计学复习资料(名词解释、简答)_第2页
统计学复习资料(名词解释、简答)_第3页
统计学复习资料(名词解释、简答)_第4页
资源描述:

《统计学复习资料(名词解释、简答)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、物流Q1341班专用复习资料统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的

2、对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按

3、照某种标准化分成不同的组别,分组后的数据称为分组数据。方法有单变量值分组和组距分组两种。众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数.几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。约有95%的数据在平均数2个标准差的范围之内。约有99%的数据在平均数3个标准差的范围之内。离散系数:是一组数据的

4、标准差与其相应的平均数之比偏态:它是对数据对称性的测度。(不要求计算,但求了解偏什么)SK<0,左偏SK=0,分布对称;SK>0,右偏参数估计:用样本统计量去估计总体的参数估计量:用来估计总体参数的统计量区间估计:在物流Q1341班专用复习资料点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到.置信水平:将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。判定系数:回归平方和占总平方和的比例。估计标准误差:度量各实际观测点在直线周围的散布状况

5、的一个统计量。残差:是因变量的观测值与根据估计的回归方程求出的预测值之差多重判定系数:多元回归中回归平方和占总平方和的比例,度量多元回归方程拟合程度的一个统计量,反映了在因变量的变差中被估计的回归方程所解释的比例。多重共线性:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。平稳序列:基本上不存在趋势的序列。季节性:时间序列在一年内重复出现的周期性波动。周期性:是时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动。线性趋势:指现象随着时间的推移而呈现出

6、稳定增长或下降的线性变化规律。(不掌握计算)二、简答:一、概率抽样与非概率抽样比较答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,无法使用样本的结果对总体相应的参数进行推断。特点是操作简便、时效快、成本低概率抽样是依据随机原则抽选样本,统计量的理论分布是存在的。可根据调查的结果对总体的有关参数进行估计。特点是技术含量高,成本较高频数:指变量值中代表某种特征的数(标志值)出现的次数。频率:每个对象出现的次数与总次数的比值二、众数中位数平均数的比较1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性

7、。(1分)(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。(1分)(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。(1分)应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。三、为什么要使用

8、变异系数答

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。