欢迎来到天天文库
浏览记录
ID:52179826
大小:53.00 KB
页数:7页
时间:2020-03-24
《大学统计学复习资料.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、统计学1.什么是定性数据:分类数据和顺序数据说明的是事物的品质特征,通常用文字来表述,其结果均表现为类别,因而也可统称为定性数据或品质数据。【1.分类数据:是只能归于某一类别的非数值型数据,它是对事物进行分类的结果,数据表现为类别,只是用文字来表述。顺序数据:是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。】什么是定量数据:数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此;也可称为定量数据或数量数据。【数值型数据:是按数字尺度测量的观测值,其结果表现为具体的数值。】P52.抽样误差的大小与哪些因素有关:P30样本量的大小,样
2、本量越大,抽样误差越小。总体的变异性,总体的变异性越大,抽样误差越大。3.品质数据有哪些图形表示方式(3.2):P43条形图、帕累托图、饼图、环形图、累积频数分布图。4.什么是中位数:是一组数据排序后处于中间位置上的变量值,用Me表示。中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势。中位数位置的确定公式:n+1/2(n为数据个数).P75什么是四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分
3、为4部分,其中每部分包含25%的数据。中间的四分位数就是中位数,处在25%位置上的数值称为下四分位数,处在75%位置上的数值称为上四分位数。P77平均数的各种计算方式:P785.众数、中位数和平均数的特点与应用场合P82:(1)众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能是一个众数,也可能有两个或多个众数,也可能是没有众数。众数只有在数据量较多时才有有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。(2)中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也
4、许是一个好的选择。中位数主要适合作为集中趋势测度值。(3)平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。6.什么是离群点P88:在平均数+-3个标准差的范围内几乎包含了全部数据,而在+-3个标准差之外的数据,在统计上称为离群点什么是离散系数P89:也称为变异系数,它是一组数据的标准差与其相应的平均数之比。计算公式:,,,离散系数是测度数据离散程度的相对统计量,主
5、要用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。5.什么是样本平均数P147:在统计中经常用到平均数,如果是由样本求出的,就叫做样本平均数样本平均数的抽样分布:样本均值的抽样分布是所有的样本均值形成的分布,即μ的概率分布。样本均值的抽样分布在形状上却是对称的。随着样本量n的增大,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值μ,方差为总体方差的1/n。6.46.样本比例的抽样分布6.5P150(二)样本比例的抽样分布比例是指具有某种属性的单位占全部单位数的比重。总
6、体比例(通常用表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据。样本比例(通常用p表示)是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的。描述所有可能样本比例的概率分布就是样本比例的抽样分布。当样本容量比较大时,样本比例p近似服从正态分布,且有p的数学期望就是总体比率,即s而P的方差与抽样方法有关,在重置抽样下为在不重置抽样下为即在重置抽样时,p的分布为p~N(,)在不重置抽样时,p的分布为p~N(,)
7、一般讲,当np≥5,并n(1-p)≥5时,就可以认为样本容量足够大。对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,当N比较大,而n/N5%时,修正系数可以近似为1,这时也可以按重置抽样计算。从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高。5.样本方差的抽样分布6.6P153样本方差的抽样分布样本方差的抽样分布是指在重复选取容量为n的样本时,样本方差的所有可能取值形成的概率分布。χ2分布具有如下性质和特点:(1)χ2分布的变量值始终为正。(2)χ2(n)
此文档下载收益归作者所有