考研备考-应用统计硕士考研统计学知识要点汇总(四).docx

考研备考-应用统计硕士考研统计学知识要点汇总(四).docx

ID:62480392

大小:16.79 KB

页数:6页

时间:2021-05-08

考研备考-应用统计硕士考研统计学知识要点汇总(四).docx_第1页
考研备考-应用统计硕士考研统计学知识要点汇总(四).docx_第2页
考研备考-应用统计硕士考研统计学知识要点汇总(四).docx_第3页
考研备考-应用统计硕士考研统计学知识要点汇总(四).docx_第4页
考研备考-应用统计硕士考研统计学知识要点汇总(四).docx_第5页
资源描述:

《考研备考-应用统计硕士考研统计学知识要点汇总(四).docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、应用统计硕士培养过程须突出应用统计实践导向,随着我国统计事业发展对专门人才的迫切需要,应用统计硕士的报考率也越来越高。应用统计硕士需要掌握统计学相关知识。下面小编整理的“2020年考研应用统计硕士考研统计学知识要点:方差分析”文章,希望对大家有所帮助。方差分析1.通过分析数据的误差判断各总体均值是否相等;研究一个或多个分类型自变量对一个数值型因变量的影响单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量2.(1)仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异这种差异也可能是由于抽样的

2、随机性所造成的需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差。这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源(2)随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机误差系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能

3、是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差(3)数据的误差用平方和(sumofsquares)表示组内平方和(withingroups)因素的同一水平(同一个总体)下样本数据的平方和比如,零售业被投诉次数的误差平方和组内平方和只包含随机误差组间平方和(betweengroups)因素的不同水平(不同总体)下各样本之间的平方和比如,四个行业被投诉次数之间的误差平方和组间平方和既包括随机误差,也包括系统误差1.方差分析的基本假定正态性:每个总体都应服从正态分布对于因素的每

4、一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布方差齐性:各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等独立性:观察值是独立的(该假定不满足对结果影响较大)2.问题的一般提法:(1)设因素有k个水平,每个水平的均值分别用m1,m2,?,mk表示(2)要检验k个水平(总体)的均值是否相等,需要提出如下假设:HO:ml=m2=•••=mkH1:m1,m2,?,mk不全相等5.SST:全部观察值xij与总平均值的离差平方和,反映全部观察值

5、的离散状况SSA:各组平均值xi与总平均值xij的离差平方和;反映各总体的样本均值之间的差异程度,又称组间平方和;该平方和既包括随机误差,也包括系统误差SSE:每个水平或组的各样本数据与其组平均值的离差平方和;反映每个样本各观察值的离散状况,又称组内平方和;该平方和反映的是随机误差的大小总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系:SST=SSA+SSE如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显

6、著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小6.均方各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差计算方法是用误差平方和除以相应的自由度三个平方和对应的自由度分别是SST的自由度为n-1,其中n为全部观察值的个数SSA的自由度为k-1,其中k为因素水平(总体)的个数SSE的自由度为n-k6.构造检验统计量将MSA和MSE进行对比,即得到所需要的检验统计量F

7、当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作岀对原假设H0的决策相应2根据给定的显著性水平a,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k的临界值Fa2若F>Fa,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响2若F7.关系强度变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映自变量平方和占总平方和的比例记为R2,即3、其平方根R就可以用来测量两

8、个变量之间的关系强度应用硕士不仅要有学术基础,还有将问题带入到实际问题中,要与实际数据实际案例紧密结合。以上是小编整理的“2020年考研应用统计硕士考研统计学知识要点:“方差分析”相关内容,希望对大家有所帮助,预祝大家都能考上理想学校

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。