安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解

安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解

ID:81265386

大小:5.64 MB

页数:181页

时间:2022-07-15

上传者:139****0001
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第1页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第2页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第3页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第4页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第5页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第6页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第7页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第8页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第9页
安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解_第10页
资源描述:

《安徽大学经济学院《432统计学》[专业硕士]历年考研真题及详解》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

目录2012年安徽大学432统计学[专业硕士]考研真题2012年安徽大学432统计学[专业硕士]考研真题及详解2013年安徽大学432统计学[专业硕士]考研真题2013年安徽大学432统计学[专业硕士]考研真题及详解2014年安徽大学432统计学[专业硕士]考研真题2014年安徽大学432统计学[专业硕士]考研真题及详解2015年安徽大学432统计学[专业硕士]考研真题2015年安徽大学432统计学[专业硕士]考研真题及详解2016年安徽大学432统计学[专业硕士]考研真题2016年安徽大学432统计学[专业硕士]考研真题及详解2017年安徽大学432统计学[专业硕士]考研真题(回忆版)及详解

12012年安徽大学432统计学[专业硕士]考研真题

2

3

4

5

6

72012年安徽大学432统计学[专业硕士]考研真题及详解一、单项选择题(共15小题,每小题4分,计60分)1设AB=∅,P(A)=0.6,P(A∪B)=0.8,则事件B的逆事件的概率为()。A.0.2B.0.6C.0.8D.0.4【答案】C【解析】P(A∪B)=P(A)+P(B)-P(AB),因为AB=∅,_即P(AB)=0,故P(B)=P(A∪B)-P(A)=0.2,因此P(B)=1-P(B)=0.8。2A,B是任意两个事件,0<P(A)<1,P(B)>0,P(B|A)_=P(B|A),则必有()。_A.P(A|B)=P(A|B)__B.P(A|B)=P(A|B)C.P(AB)=P(A)P(B)

8D.P(AB)≠P(A)P(B)【答案】C【解析】因为P(B|A)=P(AB)/P(A),由题意有即P(AB)-P(A)P(AB)=P(A)P(B)-P(A)P(AB),所以P(AB)=P(A)P(B)。3已知随机变量X服从二项分布且E(X)=2,D(X)=1.44,则二项分布的参数n,p的值为()。A.n=4,p=0.6B.n=6,p=0.4C.n=8,p=0.3D.n=24,p=0.1【答案】B【解析】二项分布的期望和方差的计算公式为:EX=np,DX=np(1-p),本题中EX=np=2.4,DX=np(1-p)=1.44,解得

9【说明】本题的题目设置有误,题目中的EX应该等于2.4,若按照题目中的EX=2则无解(因为n必须为整数)4某地区零售总额比上年增长20%,扣除价格因素影响,实际增长11%,以此计算该地区物价指数为()。A.9%B.8.1%C.109%D.108.1%【答案】D【解析】居民消费价格指数=商品零售名义总额/商品零售实际总额,设去年的商品零售总额为1,则CPI=(1+20%)/(1+11%)=108.1%。5统计调查中的代表性误差()。A.只在抽样调查中存在B.只在典型调查中存在C.只在重点调查中存在D.存在于所有的非全面调查中【答案】D

10【解析】统计调查误差,就是调查结果所得的统计数字与调查总体实际数值之间的离差。统计调查误差可分为登记性误差和代表性误差。登记性误差是由于错误登记事实而发生的误差,不管是全面调查或是非全面调查都会产生登记性误差。代表性误差,只有非全面调查中才有,全面调查不存在这类误差。非全面调查由于只对调查现象总体的一部分单位进行观察,并用这部分单位算出的指标来估计总体的指标,而这部分单位不能完全反映总体的性质,它同总体的实际指标会有一定差别,这就发生了误差。6假如各组指标值都扩大两倍,而频数都减少为原来的1/3,那么平均数()。A.不变B.减少为原来的1/3C.扩大两倍D.无法计算【答案】C【解析】分组数据平均数的计算公式为:式中xi为各组指标值,fi为各组指标值的频数。当各组指标值都扩

11大2倍而频数减少为原来的1/3时,7某市国内生产总值的平均增长速度:2001~2003年为12%,2004~2006年为9%,则这6年的平均增长速度为()。A.B.C.D.【答案】A【解析】设这六年的平均增长速度为x,2004年的国内生产总值为a,则有:a×(1+x)6=a×(1+12%)3×(1+9%)3解得故选A。

128在计算增长率的平均数时,通常采用()。A.简单平均数B.几何平均数C.算术平均数D.调和平均数【答案】B【解析】几何平均数是N项标志值的连乘积的N次方根。几何平均数一般应用于具有等比趋势数列的平均数,因为这时标志值总量等于各标志值的连乘积。在社会经济现象中,许多现象变化的总比率或总速度常常是各项比率或各项速度的连乘积,所以要用几何平均数计算平均比率或平均发展速度。9各变量值与其()的离差之和等于零。A.中位数B.众数C.均值D.标准差【答案】C【解析】均值是一组数据相加后除以数据的个数得到的结果,计算公式为

13各变量与其均值的离差之和为10下列数字特征中,度量随机变量取值的离散程度的是()。A.期望值B.方差C.协方差D.相关系数【答案】B【解析】数据的离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用的测度值,根据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以及测度相对离散程度的离散系数等。11一本书排版后,一校时出现的平均错误处数为200,标准差为

14400。随机抽取排版后的一本书稿,出现错误的处数不超过230的概率为()。A.0.93B.0.80C.0.85D.0.85【答案】A【解析】用随机变量X表示出错的处数,假定服从正态分布,即X~N(200,400),出现错误的处数不超过230的概率为所以出现错误数不超过230的概率为0.93。【说明】本题题干中应该为方差为400,而非标准差。12以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的是()。A.95%的置信区间比90%的置信区间宽B.样本容量较小的置信区间较小C.相同置信水平下,样本容量大的区间宽D.样本均值越小,区间越大【答案】A

15_【解析】当总体服从正态分布且σ2已知时,样本均值x的抽样分布均为正态分布,其数学期望为总体均值μ,方差为σ2/n。样本均值经过标准化以后的随机变量则服从标准正态分布,总体均值μ在1-α置信水平下的置信区间为,1-α称为置信水平;zα/2是标准正态分布右侧面积为α/2时的Z值。置信水平越大置信区间越宽;样本容量越大置信区间越窄;置信区间的宽度与样本均值的大小无关。∧13在线性回归方程Yi=48.53+2.87Xi中,2.87说明()。A.X每增加一个单位,Y肯定会增加2.87个单位B.X每增加一个单位,Y平均会增加2.87个单位C.X平均增加一个单位,Y会增加2.87个单位D.X平均增加一个单位,Y肯定会增加2.87个单位【答案】B【解析】一元线性回归方程的形式为:E(y)=β0+β1x,一元线性回归方程的图示是一条直线,因此也称为直线回归方程。其中β0是回归直线在y轴上的截距,是当x=0时y的期望值;β1是直线的斜率,它表示x每变动一个单位时,y的平均变动值。14回归方程的可决系数数值越大,则回归线()。A.越接近Y的总体平均值B.越接近Y的样本观察值C.越接近Y的预测值

16D.越接近于Y的估计值【答案】B【解析】可决系数是指回归平方和在总变差中所占的比重。可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。15要通过移动平均法消除季节变动,则移动平均项数N()。A.应选择奇数B.应选择偶数C.应和季节周期长度一样D.可以任意取值【答案】C【解析】移动平均法的主要特点有:①移动平均时距项数N为奇数时,只需一次移动平均,其移动平均值作为移动平均项数的中间一期的趋势代表值;而当移动平均项数N为偶数时,移动平均值代表的是这偶数项的中间位置的水平,无法对正某一时期,则需要在进行一次相临两项平均值的移动平均,这才能使平均值对正某一时期,这称为移正平均,也称为中心化的移动平均数;②当序列包含季节变动时,移动平均时距项数N应与季节变动长度一致,才能消除其季节变动;若序列包含周期变动时,平均时距项数N应和周期长度基本一致,才能较好的消除

17周期波动。二、填空题(10题,每小题3分,计30分)1设袋中有50个乒乓球,其中20个是黄球,30个是白球,现在有两人依次随即从袋中取一个球,取后不放回,则第二个人取得的是黄球的概率______。【答案】0.4【解析】设事件A1表示“第一个人取得黄球”,事件A2表示“第一个人取得白球”,事件B表示“第二个人取得黄球”,则由全概率公式有:故第二个人取得的是黄球的概率是0.4。2在3次独立实验中,事件A出现的概率相等,若已知A至少出现一次的概率为19/27,则事件A在一次试验中出现的概率为______。【答案】1/3【解析】设事件A出现的概率为p,事件B表示“3次独立实验中A至少_出现一次”,则P(B)=1-P(B)=1-(1-p)3=19/27,解得p=1/3。3假设随机变量X服从均值为2,方差为σ2的正态分布,且P{2<X<4}=0.3,则P{x<0}=______。

18【答案】0.2【解析】由题意可知X~N(2,σ2),则P(2<X<4)=P[(2-2)/σ<X<(4-2)/σ]=Φ(2/σ)-Φ(0)=0.3,因为Φ(0)=0.5,故Φ(2/σ)=0.8,所以P(X<0)=P[(X-2)/σ<(0-2)/σ]=Φ(-2/σ)=1-Φ(2/σ)=0.2,故P(X<0)=0.2。4一组样本数据为3,3,1,5,13,12,11,9,7这组数据的中位数是______。【答案】7【解析】将这组样本数据排序,结果为:1、3、3、5、7、9、11、12、13。一共有9个数据,数据个数是奇数,排在第(n+1)/2=(9+1)/2=5位的是中位数,故中位数是7。5为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法是______。【答案】分层抽样【解析】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,最后将各层的样本结合起来,对总体的目标量进行估计。本题中先按照性别特征将学生分为男、女两层,然后在男学生、女学生中抽取样本,属于分层抽样。6已知总体的均值为50,标准差为8,该总体中随机抽取容量为64的样本,则样本均值的数学期望和抽样分布的标准差为______。【答案】50;1

19【解析】根据中心极限定理:设从均值为μ、方差为σ2(有限)的任_意一个总体中抽取样本量为n的样本,当n充分大时,样本均值x的抽样_分布近似服从均值为μ、方差为σ2/n的正态分布。本题中x的数学期望为50,抽样分布的标准差为7在组距数列中,表示各组界限的变量值称为______,各组上限与下限之间的中点值称为______。【答案】组限;组中值【解析】组限指在组距式分组中,表示各组变动范围的两端的数值,其中,每组的最小值称为下(组)限,每组的最大值称为上(组)限,组限一般是决定事物性质的数量界限。组距分组掩盖了各组内的数据分布状况,为反映各组数据的一般水平,我们通常用组中值作为该组数据的一个代表值。组中值是每一组中下限值与上限值中间的值,即组中值=(下限值+上限值)/5。8增长量是报告周期水平与基期水平之差,由于基期的不同增长量可分为______增长量和______增长量。【答案】逐期;累计【解析】增长量是指时间数列中两个不同时期的发展水平之差,反映社会经济现象报告期比基期增加或减少的数量,即增长量=报告期水平一基期水平。由于采用的基期不同,增长量有以下两种:①逐期增长量,它是报告期水平与前一期水平之差,说明报告期比前一时期增长的

20绝对数量;②累计增长量,它是报告期水平与某一固定时期水平之差,它说明本期比某一固定时期增长的绝对数量,也说明在某一较长时期内总的增长量。二者的关系是:逐期增长量之和等于相应时期的累计增长量。9平均发展速度是对各期______速度求平均的结果,计算方法有______和累计法。【答案】环比发展;方程式法【解析】平均发展速度是一定时期内各个环比发展速度的平均数,它说明某种现象在一个较长时期内逐期平均发展变化的程度。平均增长速度是各个环比增长速度的平均数,但它不是根据各环比增长速度计算的,而是根据平均发展速度计算的。它说明某种现象在一个较长时期内逐期平均增长变化的程度。目前计算平均发展速度通常采用方程式法和累计法。10已知某产品产量2007年与2006年相比增长了5%,2008年与2006年相比增长了12%,则2008年与2007年相比增长了______。【答案】6.67%【解析】设该产品2006年的产量为a,则2007年的产量为(1+5%)×a,2008年的产量为(1+12%)×a,故2008年与2007年相比增长了6.67%。

21三、简答题(共4题,每题6分,计24分)1什么是相对指标?有哪些相对指标(至少举出4例)?各有什么作用?答:相对指标是运用对比的方法,来反映某些相关事物之间数量联系程度的综合指标。相对指标按其作用不同可划分为六种|:结构相对指标、比例相对指标、强度相对指标、动态相对指标、比较相对指标和计划相对指标。(1)结构相对指标结构相对指标总体的某一部分与总体数值相对比求得的比重或比率指标,通常用来反映总体的结构和分布状况等。实际经济工作中常用的恩格尔系数、贡献率、城市化程度、中间投入率、增加值率、消费率、合格率、市场占有率等都是结构相对数。(2)比较相对指标又称比较相对数或同类相对数。同类指标在不同空间进行静态对比形成的相对指标。可以比较不同国家、不同地区、不同单位等经济实力、发展水平和工作优劣。(3)比例相对指标又称比例相对数或比例指标。反映总体中各组成部分之间数量联系程度和比例关系的相对指标。(4)强度相对指标又称强度相对数。有一定联系的两种性质不同的总量指标相比较形成的相对指标。通常以复名数、百分数、千分数表示。

22(5)动态相对指标动态相对指标又称“动态相对数”或“时间相对指标”,就是将同一现象在不同时期的两个数值进行动态对比而得出的相对数,借以表明现象在时间上发展变动的程度。通常以百分数或倍数表示,也称为发展速度。(6)计划完成程度指标又称计划完成百分数。以计为比较标准,将实际完成数与计划规定数相比较,用以表明计划完成情况的相对指标,通常用百分数表示。2什么是数量指标?什么是质量指标?分别举例说明。答:数量指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标,用绝对数表示。其数值大小一般随总体范围的大小而增减,如商品销售量、工业产品产量等;质量指标是反映社会经济现象相对水平或平均水平的统计指标,用平均数或相对数表示,比如劳动生产率、单位面积产量、单位产品成本等。3什么是时间序列?举例说明。时间序列的构成因素有几种?测定时间序列的长期趋势有哪几种方法?答:(1)时间序列是同一现象在不同时间上的相继观察值排列而成的序列。经济数据大多数以时间序列的形式给出,比如2010~2012年我国的国内生产总值就是时间序列。(2)时间序列的成分可以分为4种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。(3)时间序列的趋势可以分为线性趋势和非线性趋势两大类,如果

23这种趋势能够延续到未来,就可以利用趋势进行外推预测。有趋势序列的预测方法主要有线性趋势预测、非线性趋势预测和自回归模型预测等。4什么是指数因素分析?有哪几种指数因素分析?因素分析的一般步骤。答:因素分析法是利用统计指数体系分析现象总变动中各个因素影响程度的一种统计分析方法,包括连环替代法、差额分析法、指标分解法等。因素分析的一般步骤包括:(1)确定分析对象,并计算出实际与目标数的差异;(2)确定该指标是由哪几个因素组成的,并按其相互关系进行排序(排序规则是:先实物量,后价值量;先绝对值,后相对值);(3)以目标数为基础,将各因素的目标数相乘,作为分析替代的基数;(4)将各个因素的实际数按照上面的排列顺序进行替换计算,并将替换后的实际数保留下来;(5)将每次替换计算所得的结果,与前一次的计算结果相比较,两者的差异即为该因素对成本的影响程度;(6)各个因素的影响程度之和,应与分析对象的总差异相等。四、计算分析题(共3题,每小题12分,计36分)1设连续随机变量X的密度函数为

24(1)求常数C;(2)求随机变量X的取值落在(-1/2,1/2)内的概率。解:(1)由密度函数的性质有:解得C=1/π。(2)由第一问的计算结果可知X的密度函数为:故

252某种生产线上的感冒冲剂规定每包重量为12克,超重或者是过轻都会产生严重的后果。从过去的资料得知σ是0.6克,质检员每两小时抽取25包冲剂称重检测,并作出是否停工的决策。假定产品质量服从正态分布。(1)建立适当的原假设和备择假设;(2)在α=0.05时,该检验的决策准则是什么;_(3)若x=12.25克,质检员将采取什么行动;_(4)若x=11.95克,质检员将采取什么行动。解:(1)原假设H0:μ=12备择假设H1:μ≠12(2)α=0.05,有zα/2=1.96,计算出统计量的值,比较|z|与zα/2的大小,若|z|>zα/2则拒绝原假设,否则接受原假设。_(3)已知x=12.25,计算检验统计量:

26所以拒绝原假设,质检员将做出停工的决策。_(4)已知x=11.95,计算检验统计量:因为|z|<zα/2=1.96,所以接受原假设,质检员将做出不停工的决策。3已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农副产品收购价格总指数为105%试考虑,1998年比1997年相比:(1)农民因农副产品共增加多少收入;(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3)由于农副产品收购价格提高了5%农民又增加了多少收入?(4)验证以上三个方面分析得出的结论是否一致。解:(1)1998年收购总额为360×(1+12%)=403.2(亿元),因此增加收入为403.2-360=43.2(亿元)。(2)总指数=价格指数×销售量指数,即403.2/360=105%×x,解得x=106.67%,农副产品收购量增加了6.67%。故kq=∑q1p0/∑q0p0=106.67%,即∑q1p0=384,384-360=24(亿元),农民因此增加了24

27亿元的收入。(3)由题意有∑p1q1/∑p0q1=105%,解得∑p0q1=384,403.2-384=19.2(亿元),故农民又增加了19.2亿元的收入。(4)因为43.2=24+19.2,故以上三个方面分析得出的结论一致。

282013年安徽大学432统计学[专业硕士]考研真题

29

30

31

32

33

34

35

362013年安徽大学432统计学[专业硕士]考研真题及详解一、单项选择题(共30小题,每小题2分,计60分)1为了调查某校学生的生活费用开支,从男生中抽取50名学生调查,从女生中抽出50名学生调查,这种抽样方法属于()。A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样【答案】D【解析】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。本题中先根据性别分为男女两层,再在各层中独自抽取样本,属于分层抽样。2统计表的横行标题写在表的()。A.上方B.左方C.右方D.下方

37【答案】B【解析】统计表一般由五个部分组成,即表头、行标题、列标题、数字资料和表外附加构成。表头应该放在表的上方,它说明的是表的主要内容;行标题和列标题一般放在表的第一列和第一行,它表示的是所研究问题类别的名称和指标名称;表的其余部分是具体的数字资料:表外附加通常放在统计表的下方,用来说明资料来源、指标注释和必要的说明等内容。3某地区商品零售总额比上年增长20%,扣除价格因素,实际增长为11%,依此计算该地区的物价指数为()。A.9%B.8.1%C.109%D.108.1%【答案】D【解析】居民消费价格指数=商品零售名义总额/商品零售实际总额,设去年的商品零售总额为1,则CPI=(1+20%)/(1+11%)=108.1%。4统计调查表中的代表性误差()。A.只在抽样调查中存在B.只在典型调查中存在C.只在重点调查中存在

38D.存在于所有的非全面调查中【答案】D【解析】统计调查误差,是指调查结果所得的统计数字与调查总体实际数量之间的离差。统计调查误差可分为登记性误差和代表性误差。登记性误差是由于错误登记事实而发生的误差,不管是全面调查或是非全面调查都会产生登记性误差。代表性误差,只有非全面调查中才有,全面调查不存在这类误差。非全面调查由于只对调查现象总体的一部分单位进行观察,并用这部分单位算出的指标来估计总体的指标,而这部分单位不能完全反映总体的性质,它同总体的实际指标会有一定差别,这就发生了误差。5抽样平均误差(抽样标准误差)是指样本指标与总体指标之间的()。A.实际误差B.可能误差范围C.平均误差程度D.全部误差【答案】C【解析】抽样误差是指抽样方法本身所引起的误差。当由总体中随机地抽取样本时,任意一个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。抽样误差有三种表现形式:①抽样实际误差,它是指在一次具体的抽样调查中,由于随

39机因素引起的样本指标与总体指标之间的离差;②抽样平均误差,它是指抽样平均数的标准差或抽样成数的标准差,是反映抽样误差的一般水平的一个指标;③抽样极限误差,它是指样本指标与总体指标之间的误差范围。6某市国内生产总值的平均增长速度:2005~2007年为12%,2008~2010年为9%,则这6年的平均增长速度为()。A.B.C.D.【答案】D【解析】设这六年的平均增长速度为x,2004年的国内生产总值为a,则有:a×(1+x)6=a×(1+12%)3×(1+9%)3解得故选D项。7为了估计全国高中学生的平均身高,从30个城市中选取了100所中学进行调查。在该研究中,研究者最感兴趣的变量是()。

40A.100所中学的学生数B.30个城市的中学数C.全国高中学生的身高D.全国的高中学生数【答案】C【解析】研究者做调查的最终目的是得到全国高中学生的平均身高,中间过程中抽取的样本只是为总体的推断服务的,并不是研究者感兴趣的根本。8只能归类于某一类别的非数字型数据称为()。A.分类数据B.顺序数据C.数值型数据D.数值型变量【答案】A【解析】按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;顺序数据是只能归于某一有序类别的非数字型数据,顺序数据虽然也是类别,但这些类别是有序的;数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。9为比较多个样本间的相似性,适合采用的图形是()。

41A.环形图B.茎叶图C.雷达图D.箱线图【答案】C【解析】当有两个或两个以上变量时,可以采用多变量的图示方法,常见的有散点图、气泡图、雷达图。雷达图是显示多个变量的常用图示方法,也称为蜘蛛图,其在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外利用雷达图也可以研究多个样本之间的相似程度。10一组数据的离散系数为0.6,标准差为30,则平均数为()。A.50B.1.7C.18D.0.02【答案】A【解析】离散系数是一组数据的标准差与其相应的平均数之比。其___计算公式为:vs=s/x,即x=s/vs,将数据代入计算得x=30/0.6=50。11两组数据的平均数不等,但标准差相等,则()。

42A.平均数小的,离散程度大B.平均数大的,离散程度大C.平均数小的,离散程度小D.两者数据的离散程度相同【答案】A【解析】标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,另一方面受不同计量单位的影响。对于平均水平不同的变量值,可以通过离散系数来比较变量的离散程度。离散系数是一组数据的标准差与其相应的平均数之比。其计算公式_为vs=s/x。由题意标准差相等,则平均值小的离散程度大。12在置信水平不变的条件下,要缩小置信区间,则()。A.增加样本量B.减少样本量C.保持样本量不变D.需要改变统计样本量的抽样标准差【答案】A【解析】当样本量给定时,置信区间的宽度随着置信系数的增大而增大,从直觉上说,区间比较宽时,才会使这一区间有更大的可能性包含参数的真值;当置信水平固定时,置信区间的宽度随样本量的增大而减小,换言之,较大的样本所提供的有关总体的信息要比较小的样本多。

4313下面对相关系数的陈述哪一个是错误的()。A.度量两个变量之间的线性关系强度的统计量B.一个随机变量C.绝对值不会大于一D.不会取负值【答案】D【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,当样本观测值不同时,统计量的值也不相同,故相关系数也是一个随机变量。相关系数r的取值范围是[-1,1]。若0<r≤1,表明x与y之间存在正线性相关关系;若-1≤r<0,表明x与y之间存在负线性相关关系;若r=+1,表明x与y之间为完全正线性相关关系;若r=-1,表明x与y之间为完全负线性相关关系。可见当|r|=1时,y的取值完全依赖于x,二者之间即为函数关系;当r=0时,说明y的取值与x无关,即二者之间不存在线性相关关系。14时间序列呈现出的非固定长度的周期性波动称为()。A.趋势B.季节变动C.循环变动D.随机变动【答案】C【解析】循环变动是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。循环变动不同于趋势变动,它不是朝着单一方向的

44持续运动,而是涨落相间的交替波动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。15众数是指()的数据。A.特别出众的B.出现次数最多的C.出现次数最少的D.离群的【答案】B【解析】众数是一组数据中出现次数最多的变量值,主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中趋势的测度值。16某班学生的平均成绩是80分,标准差是10分,若已知该班学生的考试分数呈现对称分布,可以判断出考试分数在60到100分之间的学生大约占()。A.95%B.89%C.68%D.99%【答案】A

45【解析】根据3σ原则:数值分布在(μ-σ,μ+σ)中的概率为0.6826;数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;数值分布在(μ-3σ,μ+3σ)中的概率为0.9974。60~100分落入平均分数的2σ域即(μ-2σ,μ+2σ)内,故考试分数在60~100分之间的学生大约占95%。17已知总体的均值为100,标准差为16,从该总体中随即抽取样本容量为64的样本,则样本均值的数学期望和抽样分布的标准误差分别为()。A.100,16B.100,1C.100,2D.100,4【答案】C【解析】已知EX=100,DX=162,根据样本均值的抽样分布可知,__EX=100,DX=DX/n=162/64,其标准误差为18在回归分析中,因变量的预测区间估计是指()。A.对于自变量x的一个给定值x0,求出因变量y的平均值的区间B.对于自变量x的一个给定值x0,求出因变量y的个别值的区间

46C.对于因变量的一个给定值y0,求出自变量x的平均值的区间D.对于因变量一个给定值y0,求出自变量x的平均值的区间【答案】B【解析】区间估计有两种类型:一是置信区间估计,它是对x的一个给定值x0,求出y的平均值的估计区间,这一区间称为置信区间;二是预测区间估计,它是对x的一个给定值x0,求出y的一个个别值的估计区间,这一区间称为预测区间。19如果时间序列的逐期观测值按一定的增长率增长或者衰减,则适合的预测模型()。A.移动平均模型B.指数平均模型C.线性模型D.指数模型【答案】D【解析】指数模型用于预测以几何级数递增或递减的现象,即时间序列的观察值Yt按指数规律变化,或者说时间序列的逐期观察值按一定的增长率增长或衰减。指数平均模型通过对过去的观察值加权平均来进行预测。20雷达图的主要用途是()。A.反映一个个体或者是总体的结构B.比较多个总体的构成

47C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图是显示多个变量的常用图示方法,也称为蜘蛛图。雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外,利用雷达图也可以研究多个样本之间的相似程度。2190%的置信水平区间是指()。A.总体参数落在一个特定的样本所构造的区间内的概率为90%B.总体参数落在一个特定的样本所构造的区问内的概率为10%C.在用同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为90%D.在用同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为10%【答案】C【解析】一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。22在假设检验中,如果所计算的P值越小,则说明检验的结果()。A.越显著

48B.越不显著C.越真实D.越不真实【答案】A【解析】P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。而在假设检验中,原假设为不显著。故P值越小说明检验的结果越显著。23在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是()。A.一个样本观测值之间误差的大小B.全部观测值误差的大小C.各个样本均值之间的误差大小D.各个样本方差之间的误差大小【答案】C_【解析】组间平方和是各组均值x(i=1,2,…,k)与总均值的误差平方和,反映各样本均值之间的差异程度,因此又称为因素平方和。24在进行多元线性回归分析时,如果回归模型中存在多重共线性,则()。

49A.整个回归模型的线性关系不显著B.肯定有一个回归系数不能通过显著性检验C.肯定又导致某个回归系数的符号与预测的相反D.可能导致某些回归系数不能通过显著性检验【答案】D【解析】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量的回归系数t检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量间存在多重共线性。25在某一次考试中,抽取49个应试者,得到平均考试成绩为78分,标准差为12分该次考试中所有应试者的平均成绩95%的置信区间为()。A.78±1.96B.78±3.36C.78±0.48D.78±4.52【答案】B【解析】在大样本条件下,总体均值的抽样分布为:

50本题中,总体标准差未知,故用样本标准差代替。因而,该次考试中所有应试者的平均成绩μ的95%的置信区间为:故选B。__26设A、B为任意两个事件,则(A+B)(A+B)表示()。A.必然事件B.A与B恰有一个发生C.不可能事件D.A与B不同时发生【答案】B______【解析】由题意,(A+B)(A+B)=AA+BB+BA+AB=∅+∅____+BA+AB,BA+AB表示A发生B不发生或者B发生A不发生,即AB恰有一个发生。27从5双不同的鞋了中任意取出4只,这4只鞋子中至少有2只能配成对的概率为()。

51A.10/21B.11/21C.12/21D.13/21【答案】D【解析】设事件A表示“4只鞋子中至少有2只能配成一对”,则A={“能配成一对”或“能配成两对”},故28已知随机变量的概率密度函数为f(x)=Ae-|x|,则A等于()。A.1B.2C.1/2D.1/3【答案】C【解析】根据概率密度函数的性质:

52有解得A=1/2。29设随机变量X服从(2,5)上的均匀分布,先对进行3次独立观察的试验则至少有两次观察值大于3的概率为()。A.20/27B.21/27C.22/27D.23/27【答案】A【解析】由题意可知X的概率密度函数为因此X大于3的概率是

53设事件A表示“3次独立试验得到的观察值至少有2次大于3”,则A={“3次独立试验得到的观察值有2次大于3”或“3次独立试验得到的观察值有3次大于3”},所以30设随机变量X服从N(0,1),且Y=2X+1,则Y服从()。A.N(0,1)B.N(1,1)C.N(1,2)D.N(1,4)【答案】D【解析】因为X服从正态分布,Y是X的一个线性变换,故Y也服从正态分布。EX=0,DX=1,由期望和方差的性质有:E(2X+1)=2E(X)+1=1,D(2X+1)=22D(X)=4,故Y~N(1,4)。二、简答题(共4小题,每题10分,计40分)1试叙述度量统计数据分布集中趋势的指标并解释各自含义。答:集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。度量统计数据分布集中趋势的指标有众数、中位数、平均数。(1)众数是一组数据中出现次数最多的变量值。众数主要用于测度

54分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。(2)中位数是一组数据排序后处于中间位置上的变量值。中位数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。(3)平均数也称为均值,它是一组数据相加后除以数据的个数得到的值。平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。2简述时间序列分析的预测程序。答:时间序列分析的一个主要目的就是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性等。对于一个具体的时间序列,它可能只含有一种成分,也可能同时含有几种成分。含有不同成分的时间序列所用的预测方法是不同的。因此,在对时间序列进行预测时,通常包括以下几个步骤:第1步:确定时间序列所包含的成分,也就是确定时间序列的类型;第2步:找出适合此类时间序列的预测方法;第3步:对可能的预测方法进行评估,以确定最佳预测方案;第4步:利用最佳预测方案进行预测。3什么是统计学?它的研究对象和性质是什么?答:(1)统计学的概念

55统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。(2)统计学的研究对象和性质一般来说,统计学的研究对象是自然、社会客观现象总体的数量关系。统计学研究对象的性质有如下几点:①数量性数量性是统计学研究对象的基本特点,因为数字是统计的语言,数据资料是统计的原料。一切客观事物都有质和量两个方面,事物的质与量总是密切联系、共同规定着事物的性质。②总体性统计的数量研究是对总体普遍存在着的事实进行大量观察和综合分析,得出反映现象总体的数量特征和资料规律性。对于每个个体来说,具有一定的随机性质,而对于有足够多个体的总体来说又具有相对稳定的共同趋势,显示出一定的规律性。(3)具体性统计研究对象是自然、社会经济领域中具体现象的数量方面。即它不是纯数量的研究,是具有明确的现实含义的。统计学研究的数量是客观存在的、具体实在的数量表现。(4)变异性统计研究对象的变异性是指构成统计研究对象的总体各单位,除了在某一方面必须是同质的以外,在其他方面又要有差异,而且这些差异并不是由某种特定的原因事先给定的。

564设A、B工厂的产品次品率分别为1%和2%,现在从由工厂A和工厂B的产品分别占60%和40%的产品中随机抽取一件,发现是次品,则该次品属于工厂A生产的概率为多少?答:设事件A表示“产品来自于A工厂”,事件B表示“产品来自于B工厂”,事件C表示“随机抽取的产品是次品”,根据题意有P(C|A)=1%,P(C|B)=2%,P(A)=60%,P(B)=40%,根据贝叶斯公式有:故该次品属于工厂A生产的概率为3/7。三、计算和分析题(共3题,1、2题每题20分,第3题10分,共50分)1.已知某厂某天生产的工人加工的零件的数据如下表。表一某企业工厂工人日产零件数(1)计算众数、中位数(6分)(2)计算平均数和标准差(8分)

57(3)对工人加工零件的分布进行综合分析(6分)解:(1)众数是一组数据中出现次数最多的变量值,用Mo表示。由表一可看出,日产零件数为23件的工人数最多,为27人。故众数为23。中位数是将总体各个单位按其标志值的大顺序排列,处于数列中点的那个单位的标志值,用Me表示。本题是单项式分组,已经将资料的标志值序列化,确定中位数位置的方法要通过累计次数计算。3+10+14=27<40,3+10+14+27=54>40,故中位数应该是工人数为27所对应的日产零件数,为23。(2)本题的数据已经分组,并已知次数分布的条件。此时计算平均数需先将各组标志值乘以相应的次数,求得各组的标志总量。计算公式为:_式中fi为各组标志值出现的次数。代入数据计算得:x=(17×3+20×10+…+26×8)/80=1820/80=22.75分组情况下标准差的计算公式为:

58代入数据计算得(3)①集中趋势_根据结果可知,x<Me<Mo,说明数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,即数据是左偏分布的。②离散程度根据结果可知,工人加工零件的标准差为1.9268,与均值相比标准差不大,故离散系数也比较小,故数据的离散程度较小。2某企业生产的袋装食品,每袋标准重量为100克现在从某天生产的一批产品中按重复抽样随机抽取50包进行检验,测得每包重量如下:

59(1)确定该种食品平均重量的点估计和区间估计。(95%置信水平)(2)采用假设检验方法检验该食品是否符合标准要求?(α=0.05,写出假设检验的步骤)。解:(1)在大样本条件下,总体均值的抽样分布为:分组数据均值的计算公式为:式中Mi为第i个组的组中值,fi为第i个组的频数。代入数据计算得:_x=(97×5+99×16+…+105×4)/50=5028/50=100.56分组数据标准差的计算公式为:

60代入数据计算得:因而,该次考试中所有应试者的平均成绩μ的95%的置信区间为:(2)根据题意可以提出假设:H0:μ=100;H1:μ≠100这是一个双侧检验问题,所以只要μ>μ0或μ<μ0二者之中有一个成立,就可以拒绝原假设。_由题意可知,μ0=100,s=2.1275,x=100.56。因为n>30,故选用z统计量。

61α=0.05,查表可以得出临界值zα/2=1.96,因为|z|<|zα/2|,根据决策准则,接受H0,故该食品符合标准要求。3设随机变量的概率密度函数为:当0<x<2时,f(x)=ax;当2<x<4时,f(x)=cx+b;其他时,f(x)=0;且E(X)=2,P(1<x<3)=3/4。求:(1)a,b,c的值;(2)E(Y),E(ex)。解:(1)根据题意可知,随机变量X的密度函数为由期望的定义有由分布函数的性质有

62由密度函数的性质有联立上述三式,解得(2)根据第一问求出的结果,随机变量X的密度函数为

63【说明】本题问题设置有误,题目中没有提到Y,故无法求E(Y)。

642014年安徽大学432统计学[专业硕士]考研真题

65

66

67

68

69

70

71

722014年安徽大学432统计学[专业硕士]考研真题及详解一、单项选择题(共20小题,每小题2分,计40分)1对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育,这一叙述是()结果。A.定性变量B.试验C.描述统计D.推断统计【答案】D【解析】数据分析所用的方法可分为描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。本题中是根据调查的样本得出总体中“85%的高中生愿意接受大学教育”的结论,故这一叙述属于推断统计的结果。2某组距式变量数列的末组为开口组,下限为300,其邻组组中值为270,则末组组中值为()。A.230B.330

73C.540D.570【答案】B【解析】组中值是指组距数列每组下限与上限之间中点位置上的数值,组距是一个组的上限与下限的差,组距=上限-下限,组中值=(上限+下限)÷2=上限-组距/2=下限+组距/2。对于开口组的组距和组中值的确定,一般以其邻近组的组距为准。末组的临组组距=2×(300-270)=60,所以末组组中值=下限+邻组组距/2=300+60/2=330。3对于右偏分布、均值和中位数和众数之间的关系是()。A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数【答案】A【解析】如果数据的分布是对称的,众数、中位数和平均数必定相等,即众数=中位数=平均数;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:平均数<中位数<众数;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,此时众数<中位数<平均数。

744某企业有两个车间,第一车间平均工资为85元,第二车间平均工资为96,如果第一车间的工人数增加50%,第二车间人数不变,那么该企业的平均工资会()。A.增加B.减少C.不变D.不能肯定【答案】A【解析】设第一车间的工人数为n1,第二车间的工人数为n2,则原来的平均工资为后来的为故该企业的平均工资减少。5一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差是5公斤,女生的平均体重是50公斤,标准差是5公斤。体重在55

75到65公斤之间的男生占()。A.60%B.68%C.90%D.95%【答案】B【解析】根据题意可知,(55,65)=(60-5,60+5)=(μ-σ,μ+σ)。根据3σ原则,数值分布在(μ-σ,μ+σ)中的概率为0.6826,即体重在55到65公斤之间的男生占全体男生人数的68%。【说明】本题题干描述不清,没有体重在55到65公斤之间的男生占总人数的比重还是全体男生的比重,根据题目已知信息,此处应该是占全体男生的比重,即考点为3σ原则。6描述定性数据的两种最常用图示法是()。A.条形图和饼图B.散点图和饼图C.散点图和条形图D.条形图和茎叶图【答案】A【解析】定性数据包括分类数据和顺序数据,可以描绘出它们各类的比例,常用饼图和条形图表示。饼图主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分

76有用;条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。7在其他条件不变的情况下,要是估计时所需要的样本容量小,应该()。A.提高置信水平B.降低置信水平C.使置信水平不变D.使置信水平等于1【答案】B【解析】样本量与置信水平成正比,在其他条件不变的情况下,置信水平越高,所需的样本量也就越大。反之,样本量越多,置信水平则越高。8研究者想搜集证据予以支持的假设通常称为()。A.原假设B.备择假设C.合理假设D.正常假设【答案】B【解析】在假设检验中一般是把希望证明的命题放在备择假设上,而把原有的、传统的观点或结论放在原假设上,这样可以更好地体现假

77设检验的价值。因为如果我们完全认可原有的东西,就没有必要去进行检验了,正是我们对原有的东西产生怀疑,才去进行调查,希望能够用事实推翻原有的观念,带来新的结论。9与假设检验方法相比,方差分析法可以()犯第一类错误的概率。A.提高B.降低C.等于0D.等于1【答案】B【解析】总体均值的t检验或z检验,一次只能研究两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较将十分烦琐,共需进行C2次不同的检验。如果α=0.05,每次检验犯第Ⅰ类错误的概n率都是0.05,做多次检验会使犯第Ⅰ类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而犯第Ⅰ类错误的概率就会小很多。10若回归直线方程中的回归系数为0,则相关系数()。A.1B.-1C.0D.无法确定

78【答案】C【解析】在一元线性回归模型中,回归系数的计算公式为:相关系数是根据样本数据计算的,度量两个变量之间线性关系强度的统计量,样本相关系数的计算公式为:∧回归系数和相关系数的分子相同,故当β1=0时必有r=0。11按照线性回归的基本假设,自变量应当()。A.与残差不相关B.与随机扰动不相关C.与因变量不相关D.与样本条件均值不相关【答案】B

79【解析】线性回归模型有三个基本假定:①误差项(随机扰动项)ε是一个期望值为0的随机变量,即E(ε)=0;②对于所有的x值,ε的方差σ2都相同。这意味着对于一个特定的x值,y的方差也都等于σ2;③误差项(随机扰动项)ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。假定②即说明自变量与随机扰动项不相关。12下表是进口总额Y与国内生产总值GDP回归的Excel估计结果:此结果说明()。A.GDP对进出口总值的影响不显著B.进出口总值对GDP的影响不显著C.进出口总值对GDP的影响显著D.GDP对进出口总值的影响显著【答案】D【解析】由题意可知,GDP是自变量,进出口总额是因变量,因变量受到自变量的影响,因此排除BC两项。回归系数的显著性的假设为H:β=0;H:β≠0。由表中结果可知,GDP系数的P值=1.23e-11<01110.05,故检验统计量t落在拒绝域内,即认为β1≠0,因此GDP对进出口总值的影响显著。13在多元线性回归分析t检验和F检验的结果,其关系是()。

80A.分别对各回归系数的t检验和F检验是等价的B.分别对各回归系数的t检验和F检验没有关系C.F检验显示为显著,则各回归系数的t检验显示为显著D.各回归系数的t检验显示为显著,则F检验为显著【答案】B【解析】在一元线性回归中,线性关系的检验(F检验)与回归系数的检验(t检验)是等价的,但在多元回归中,这两种检验不再等价。线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在k个自变量中,只要有一个自变量与因变量的线性关系显著,F检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。14假定某工厂计划2005年比2000年产值增加40%,那么2001~2005年的平均发展速度为()。A.B.C.D.【答案】B【解析】平均发展速度是时间序列中逐期环比值(也称环比发展速度)的几何平均数,其计算公式为:

81故本题中的平均发展速度为15根据季度商品销售额数据计算的季节性指数分别是:一季度125%,二季度70%,三季度100%,四季度105%,受季节因素影响最大的是()。A.一季度B.二季度C.三季度D.四季度【答案】B【解析】季节指数刻画了序列在一个年度内各月或各季度的典型季节特征。在乘法模型中,季节指数是以其平均数等于100%为条件而构成的,它反映了某一月份或季度的数值占全年平均数值的大小。如果现象的发展没有季节变动,则各期的季节指数应等100%;如果某一月份或季度有明显的季节变化,则各期的季节指数应大于或小于100%。因此,季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定的。70%与100%的偏差最大,因此第二季度受季节因素影响最

82大。__16已知P(A)=0.5,P(B)=0.4,P(AB)=0.2,则P(AB)=()。A.0.3B.0.4C.0.5D.0.7【答案】A【解析】因为故17设离散型随机变量X的分布规律为p(x=k)=P(X=k)=αβk(k=1,2,…),且α>0,则β=()。A.β=1/(α-1)

83B.β是大于零的实数C.β=1/(α+1)D.β=α+1【答案】C【解析】根据离散型随机变量分布列的性质,即解得β=1/(α+1)。18设随机变量X与Y均服从于分布N(0,1),则以下必然正确的是()。A.X+Y~N(0,1)分布

84B.X2+Y2~χ2分布C.X2、Y2均服从于χ2分布D.X2/Y2~F分布【答案】C【解析】已知X,Y~N(0,1),则X2,Y2~χ2,X+Y~N(0,12)。当X与Y独立时BD两项才正确。19随机变量X,X都服从于正态分布N(μ,σ2),则E(X,-121X2)和D(X1-X2)为()。A.0,0B.0,2σ2C.2μ,0D.2μ,2σ2【答案】B【解析】根据题意有EX=EX=μ,DX=DX=σ2,当X和X相互121212独立时,由期望的方差的性质:E(X1-X2)=EX1-EX2=μ-μ=0D(X-X)=DX+DX-2Cov(X,X)=DX+DX=2σ212121212【说明】本题题干不严谨,应假设X1、X2相互独立。20设置X,X是来自总体N(μ,σ2)的样本,其中μ,σ2是未知12参数,则以下关于X1,X2的函数的统计量是()。

85A.(X1-X2)/2-μB.X2+X212C.X1/σD.(X-μ)2/σ1【答案】B【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。已知样本数据就能算出统计量的值,因此统计量不含未知参数。ABCD四项中只有B项不含未知参数。二、简答题(共3小题。每题8分,计24分)1什么是概率抽样?它有哪些特点?答:(1)概率抽样概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。(2)概率抽样的特点优点:①首先,抽样时是按一定的概率以随机原则抽取样本,所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中;②每个单位被抽中的概率是已知的,或是可以计算出来的;③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽

86中的概率。这就是说,估计量不仅与样本单位的观测值(也称为观察值)有关,也与其入样概率有关。缺点:①大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;②概率抽样比非概率抽样需要更多时间策划和实施;③必须遵守的抽样计划执行程序会大量增加收集资料的时间。2序时平均数与一般平均数的区别是什么?答:序时平均数与一般平均数的区别是:序时平均数平均的是现象总体在不同时期上的数量表现,是对同一现象不同时间上的数值差异的抽象化,是从动态上说明其在某一时期发展的一般水平;而一般平均数所平均的是研究对象在同一时间上的数量表现,是从静态上将总体各单位的数量差异抽象化,用以反映总体在具体历史条件下的一般水平。3什么是参数和统计量?答:统计学中把总体的指标统称为参数,而由样本算出的相应的总体指标称为统计量。参数一般是确定但未知的,统计量是变化但可知的。参数,也叫参变量,是一个变量。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。统计量是统计理论中用来对数据进行分析、检验的变量。

87三、计算分析题(共7小题,1~5小题每题12分,6、7题每题13分,计86分)1设连续型随机变量ξ的分布函数为:(1)求常数A、B的值;(2)求随机变量ξ的密度函数;(3)求ξ∈(1,2)的概率。解:(1)根据随机变量分布函数的性质:F(-∞)=0,F(+∞)=1,因为x>0故有解得。(2)根据第一问求得的结果,随机变量ξ的分布函数为:

88所以随机变量ξ的密度函数为:(3)令t=x2/2,则2市场上对某种商品的需求量ξ是随机变量,它服从上的均匀分布[2000,4000]。设每售出此种商品1吨,可获利3万元,如果囤积则每吨需浪费保养费1万元。试问需组织多少货源,才能使得利益最大?解:由题意可知,随机变量x的密度函数为

89若组织货源为y,记收益(单位:万元)为Y,则Y也为随机变量,且是x的函数:令dEY/dy=(-2y+7000)/1000=0,解得y=3500(吨)。3某年级经济学专业和金融学专业学生统计学课程考试成绩如下:

90(1)分别计算两个专业学生统计学课程平均成绩;(2)比较说明哪个专业的平均成绩更具有代表性。解:(1)分组数据平均数的计算公式为:式中Xi表示第i个组的组中值;fi表示第i个组的权数;n表示组数。_统计学专业的课程平均成绩为:X1=(55×3+65×10+…+95×7)/60=4740/60=79(分)_金融学专业的课程平均成绩为:X2=(55×5+65×12+…+95×5)/60=4570/60≈76.17(分)

91(2)分别求两个专业的标准差:_两个专业的离散系数分别为:v1=s1/x1=10.6086/79≈0.1343,v2=_s2/x2=10.9066/76.17≈0.1432综上所述,统计学专业课程的平均成绩高于金融学专业课程的平均成绩,并且统计学专业课程的成绩的离散程度要低于金融学专业课程的成绩,故统计学专业的平均成绩更具有代表性。4为了调查某单位家庭每天观看电视的平均时间,从该单位随机抽取36户,得样本均值6.75小时,标准差为2.4小时,求:(1)以95%的置信水平估计该单位家庭观看电视时间的置信区间:(2)在95%的置信水平下,要使得估计误差不超过0.5,应该调查多少户家庭。

92_解:(1)根据抽样结果可得:x=6.75,s=2.4,由于n=36>30,在大样本条件下,总体均值的抽样分布为:当总体标准差未知时,可用样本标准差s替代。因而,该单位家庭观看电视时间的95%置信区间为:(2)估计误差即将zα/2=1.96,s=2.4,E=0.5代入计算得n=1.962×2.42/0.52≈89(户)。5设

93x1,x2,…,xn为ξ的一组观察值,求θ的极大似然估计。解:Xi的概率密度函数为似然函数为:对数似然函数令

94解得故θ的极大似然估计为。_6设总体ξ服从N(α,σ2),ξ,S2分别为样本幅,{ξ,ξ,…,n12ξ}均值和样本方差,又设ξ也服从N(α,σ2),且ξ和{ξ,ξ,nn+1n+112…,ξn}相互独立,试求统计量的抽样分布。_解:ξ~N(a,σ2/n),nS2/σ2~χ2(n-1),ξ~N(a,σ2)nn+1_因为ξn+1和{ξ1,ξ2,…,ξn}相互独立,故ξn+1与ξ也相互独立,有:即

95由t分布的定义可知即7某产品指标服从正态分布,它的标准差σ为150小时,今由一批产品中随机抽取25个,测得指标的平均值为1637小时,问在5%的显著水平下,能否认为该批产品指标为1600?解:本题为正态总体均值的双侧假设检验问题。首先给出检验的假设:H0:μ=1600;H1:μ≠1600检验统计量为

96_将x=1637,μ0=1600,σ=150,n=25带入计算得:由于|z|=1.23<|zα/2|=1.96,即z的值落在接受域,所以接受H0,故可以认为该批产品指标为1600。

972015年安徽大学432统计学[专业硕士]考研真题

98

99

100

101

102

103

104

105

106

107

108

1092015年安徽大学432统计学[专业硕士]考研真题及详解一、单项选择题(本题包括1~30题共30个小题,每小题2分,共60分,在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题卡相应的序号内)1推断统计的主要功能是()。A.应用总体的信息描述总体B.描述样本中包含的信息C.描述总体中包含的信息D.应用样本信息描述总体【答案】D【解析】数据分析所用的方法可分为描述统计方法和推断统计方法。描述统计是研究数据搜集、处理、汇总、图表描述、概括与分析等统计学方法,其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。推断统计是研究如何利用样本数据来推断总体特征的统计方法,内容包括参数估计和假设检验两大类。2对于不等距数列,在制作直方图时,应计算出()。A.频数分布

110B.频数密度C.各组次数D.各组组距【答案】B【解析】对异距分组绘制直方图时,纵轴常常以频数(次数)密度表示,所以应计算出频数密度。3某研究人员正在收集定性数据,如婚姻状况包括独身、已婚或离异,这些分组又可以称为()。A.散点B.样本C.类别D.众数【答案】C【解析】定性数据只能反映现象的属性特点,而不能说明具体量的大小和差异。分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据,本题中“独身”“隐婚”或“离异”没有量的特征,只有分类特征,因此这些分组又可以称为类别。4为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查,在该项研究中,样本是()。A.100所中学

111B.20个城市C.全国的高中学生D.100所中学的高中学生【答案】D【解析】样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。抽样的目的是根据样本提供的信息推断总体的特征。本题的目的是“估计全国高中学生的平均身高”,因此抽取的100所中学的高中学生是样本,用样本提供的信息,即100所中学的高中学生的平均身高去估计全国高中学生的平均身高。5在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分。中位数是86分,则新员工得分的分布形状是()。A.对称的B.左偏的C.右偏的D.无法确定【答案】B【解析】如果数据的分布是对称的,众数(Mo)、中位数(Me)和__平均数(x)必定相等,即Mo=Me=x;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠拢,而众数和中位数由_于是位置代表值,不受极值的影响,因此三者之间的关系表现为:x<Me<Mo;如果数据是右偏分布,说明数据存在极大值,必然拉动平均

112_数向极大值一方靠,则Mo<Me<x。根据皮尔逊经验公式,众数=3×中位数-2×平均数,算得众数为98,有平均数<中位数<众数,因此是左偏分布。6某班学生的数学平均成绩是78分,最高分是95分,最低分是61分,根据这些信息可以计算的离散程度的测度指标是()。A.方差B.极差C.标准差D.变异系数【答案】B【解析】极差又称全距,是最简单的离散指标,它是一组数据中的最大值和最小值之差。ACD三项均需要求出方差,根据本题已给条件无法求出方差。7一项关于大学生体重的调查显示。男生的平均体重是60公斤。标准差为5公斤,女生的平均体重是50公斤,标准差为5公斤。体重在40~60公斤之间的女生占()。A.60%B.68%C.90%D.95%

113【答案】D【解析】根据3σ原则:数值分布在(μ-σ,μ+σ)中的概率为0.6826;数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;数值分布在(μ-3σ,μ+3σ)中的概率为0.9974。40~60公斤落入女生平均身高的2σ域内,即(μ-2σ,μ+2σ)内,故概率为95%。【说明】本题题干描述不清,没有体重在40~60公斤之间的女生占总人数的比重还是全体女生的比重,根据题目已知信息,此处应该是占全体女生的比重,即考点为3σ原则。8在样本容重不变的条件下,置信区间越宽,则()。A.可靠性越大B.可靠性越小C.估计的效率越高D.估计的效率越低【答案】A【解析】置信度表达了区间估计的可靠性,置信区间表达了区间估计的精确性。在其他条件不变时,置信度越大,抽样估计的置信区间就越宽,允许误差范围越大,可靠性越高;同时,由于误差的大小与估计的精确度是反向变化的关系,所以置信度越大,估计的精确度就越低。9研究者想收集证据予以支持的假设通常称为()A.原假设B.备择假设

114C.合理假设D.正常假设【答案】B【解析】在假设检验中一般是把希望证明的命题放在备择假设上,而把原有的、传统的观点或结论放在原假设上,这样可以更好地体现假设检验的价值。因为如果我们完全认可原有的东西,就没有必要去进行检验了,正是我们对原有的东西产生怀疑,才去进行调查,希望能够用事实推翻原有的观念,带来新的结论。10在假设检验中,当原假设错误时未拒绝原假设,所犯的错误称为()。A.第Ⅰ类错误B.第Ⅱ类错误C.取伪错误D.取真错误【答案】BC【解析】对于原假设提出的命题我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。这是依据样本提供的信息进行判断的,因此判断有可能正确也有可能不正确,即面临着犯错误的可能。所犯的错误有两种类型,第Ⅰ类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;第Ⅱ类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误。

115【说明】本题选项设置有误,BC两项均正确。11单因素方差分析只涉及()。A.一个分类型自变量B.一个数值型自变量C.两个分类型自变量D.两个数值型因变量【答案】A【解析】根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。当方差分析中只涉及一个分类型自变量时称为单因素方差分析。在只有一个因素的方差分析(称为单因素方差分析)中,涉及两个变量:一个是分类型自变量,一个是数值型因变量。12在方差分析中,假定每个总体的方差()。A.相等B.不相等C.等于0D.大于0【答案】A【解析】方差分析中有三个基本假定:①每个总体都应服从正态分布。即对于因素的每一个水平,其观测值是来自正态分布总体的简单随

116机样本;②各个总体的方差σ2必须相同,即各组观察数据是从具有相同方差的正态总体中抽取的;③观测值是相互独立的。13居民收入与储蓄额之间的相关系数可能是()。A.-0.9247B.0.9247C.-1.5362D.1.5362【答案】B【解析】相关系数r是根据样本数据计算的度量两个变量之间线性关系强度的统计量。r的取值范围是[-1,1],即-1≤r≤1。若0<r≤1,表明x与y之间存在正线性相关关系;若-1≤r<0,表明x与y之间存在负线性相关关系;若r=+1,表明x与y之间为完全正线性相关关系;若r=-1,表明x与y之间为完全负线性相关关系;当r=0时,说明y的取值与x无关,即二者之间不存在线性相关关系。居民收入越多,储蓄额就越多。两者为正相关关系,即0<r≤1,B项符合。14由最小二乘法得到的回归直线。要求满足因变量的()。A.平均值与其估计值的离差平方和最小B.实际值与其平均值的离差平方和最小C.实际值与其估计值的离差和为0D.实际值与其估计值的离差平方和最小【答案】D

117【解析】在回归模型中,回归系数通常用最小二乘法进行估计。最∧小二乘法是通过使因变量的观测值yi与估计值yi之间的离差平方和达到最小来估计参数的方法。15对具有因果关系的现象进行单一方程回归分析时()。A.只能将原因作为自变量B.只能将结果作为自变量C.二者均可作为自变量D.没有必要区分自变量【答案】A【解析】在回归分析中,被预测或被解释的变量称为因变量,用来预测或解释因变量的一个或多个变量称为自变量。因果关系中原因是用来解释结果的,因此原因是自变量,且只有原因能作为自变量。16在多元回归分析中,多重共线性是指模型中()、A.两个或两个以上的自变量彼此相关B.两个或两个以上的自变量彼此无关C.因变量与一个自变量相关D.因变量与两个或两个以上的自变量相关【答案】A【解析】当回归模型中使用两个或两个以上的自变量时,这些自变量往往会提供多余的信息,即这些自变量之间彼此相关。当回归模型中

118两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。17在一元回归中分析t检验和F检验的关系,不正确的判断是()。A.t检验和F检验的结果是等价的B.t检验和F检验的结果没有关系C.t统计量越大,F统计量越大D.t统计量越小,F统计量越小【答案】B【解析】在一元线性回归中自变量只有一个,F检验和t检验是等价的,t统计量越大(越小),F统计量也越大(越小);但在多元回归分析中,这两种检验的意义是不同的。F检验只是用来检验总体回归关系的显著性,而t检验则是检验各个回归系数的显著性。18时间序列中的每项指标数值可以相加的是()。A.相对数时间序列B.时期序列C.平均数时间序列D.时点序列【答案】B【解析】时间序列分为三类:①绝对数时间序列,它是由时期总量

119指标排列而成的时间序列,序列中的指标数值具有可加性;②相对数时间序列,它是把一系列同种相对数指标按时间先后顺序排列而成的时间序列,序列中的指标数值不具有可加性;③平均数时间序列,它是指由一系列同类平均指标按时间先后顺序排列的时间序列,序列中的指标数值不具有可加性。时期序列是指由同一现象若干不同时期的时期指标按时间顺序排列所形成的时间序列;时点序列是指同一现象在不同时点上的时点指标按时间顺序排列所形成的时间序列。时期序列中的指标数值具有可加性。19总指数与个体指数的主要差异是()。A.指标形式不同B.计算范围不同C.计算方法不同D.计算范围和方法均不同【答案】D【解析】个体指数是考察总体中个别现象或个别项目数量变动的相对数,总指数是综合反映多种项目数量变动的相对数。由于多种事物的使用价值不同,其数量不具有直接综合的性质,所以总指数的计算不能使用个体指数直接对比的方法,而需要使用专门的方法。总指数和个体指数的区别不仅在于考察范围不同,也在于计算方法不同。20某商品销售量去年比前年增长10%,今年比去年增长20%,则两年平均增长()。A.14.14%

120B.30%C.15%D.14.89%【答案】D【解析】平均增长率也称平均增长速度,它是时间序列中逐期环比值(也称环比发展速度)的几何平均数减1后的结果,其计算公式为:所以该商品销售量的年平均增长率为21以A表示事件“甲种产品畅销,乙种产品滞销”,则其对立事件为()。A.“甲种产品滞销,乙种产品畅销”B.“甲、乙两种产品均滞销”C.“甲种产品滞销”D.“甲种产品滞销或乙种产品畅销”【答案】D【解析】若A∪B=S且A∩B=∅,则称事件A与事件B互为逆事件,又称事件A与事件B互为对立事件,即对每次试验而言,事件A、B中必有且仅有一个发生。如果A事件不发生,则它的对立事件必然发生。用

121A1表示“甲种产品畅销”,用A2表示“乙种产品滞销”,A=A1∩A2,则即表示“甲种产品滞销或乙种产品畅销”。22设事件A和B满足P(B|A)=1,则()。A.A是必然事件B.A⊃BC.A⊂B_D.P(AB)=0【答案】D【解析】由题意可知P(B|A)=P(AB)/P(A)=1,即P(A)=_P(AB),得A⊂B,P(AB)=P(A)-P(AB)=0。23对于任意的两个事件A和B,与A∪B=B等价的是()。A.A⊂B__B.B⊂A_C.AB=∅_D.AB=∅【答案】C_【解析】由A∪B=B得A⊂B,因此有AB=∅。

12224某人向同一目标独立重复射击,每次射击命中目标的概率为p(0<p<1),则此人第4次射击恰好第2次命中目标的概率为()。A.3p(1-p)2B.6p(1-p)2C.3p2(1-p)2D.6p2(1-p)2【答案】C【解析】由题意可知,第4次射击正好命中目标,则前三次射击中有一次命中目标,故概率为_25设P(A)=a,P(B)=b,P(A+B)=c,则P(AB)为()。A.a-bB.c-bC.a(1-b)D.b-a【答案】B【解析】P(A+B)=P(A∪B)=P(A)+P(B)-P(AB)=

123__P(B)+P(AB),即得P(AB)=c-b。26若要φ(x)=cosx可以成为随机变量X的概率密度函数,则X的可能取值区间为()。A.[0,π/2]B.[π/2,π]C.[0,π]D.[3π/2,7π/4]【答案】A【解析】设X的取值区间为L,由概率密度函数的性质有A选项符合。27设随机变量X服从正态分布N(μ,σ2),则随σ的增大,概率P(|X-μ|<σ)为()。A.单调增大B.单调减小C.保持不变D.增减不定【答案】C

124【解析】由题意可知(X-μ)/σ~N(0,1),P(|X-μ|<σ)=P(|X-μ|/σ<1)=P[-1<(X-μ)/σ<1]=Φ(1)-Φ(-1)。因为Φ(-1)=1-Φ(1),故P(|X-μ|<σ)=2Φ(1)-1。28设两个相互独立的随机变量X和Y的方差为2和4,则随机变量3X-2Y的方差为()。A.8B.16C.34D.44【答案】C【解析】由题意可知D(X)=2,D(Y)=4,因为X、Y相互独立,有:D(aX±bY)=a2D(X)+b2D(Y)代入计算得D(3X-2Y)=9×2+4×4=34。29设随机变量X服从二项分布B(n,p),且EX=2.4,DX=1.44,则n,p的值是()。A.n=4,p=0.6B.n=6,p=0.4C.n=8,p=0.3D.n=3,p=0.8

125【答案】B【解析】二项分布的期望和方差的计算公式为:EX=np,DX=np(1-p),根据题意有解得30设随机变量ξ服从正态分布N(μ,σ2),且P(ξ≤c)=P(ξ>c),则c=()。A.0B.μC.-μD.σ【答案】B【解析】P(ξ≤c)=P[(ξ-μ)/σ<(c-μ)/σ]=Φ[(c-μ)/σ],P(ξ>c)=1-Φ[(c-μ)/σ],因为P(x≤c)=P(x>c),故Φ[(c-μ)/σ]=1/2,即(c-μ)/σ=0,解得c=μ。二、简答题(本小题包括1~4题共4个小题,每题10分,共40分)

1261数值平均数与位置平均数有何异同?答:数值平均数与位置平均数的异同:(1)相同点:数值平均数和位置平均数均是平均数指标,代表了总体的平均水平。平均数从其计算方法上看,可分为数值平均数和位置平均数。数值平均数是根据统计分布数列中所有单位的标志值计算出来的平均数,包括算术平均数、调和平均数、几何平均数;位置平均数则是根据标志值在统计分布数列中所处的位置确定的平均数,包括中位数和众数。(2)不同点:数值平均数是根据数据计算所得,精确性较强,但抗干扰性较弱,容易受到异常值的影响;位置平均数依数量指标位置而定,抗干扰性强,但数据信息含量少,精确性却较低。2简述中心极限定理。答:中心极限定理是统计学中常用的一个定理,在处理实际问题的时候常用到该定理。中心极限定理(centrallimittheorem):设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n_充分大时,样本均值X的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。在统计学中,由于正态分布有着十分重要的地位,因此常把证明其极限分布为正态分布的定理统称为中心极限定理。3什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?答:同度量因素亦称“同度量系数”或“指数权数”。是指使若干由于度量单位不同而不能直接相加的指标,过渡到或转化为可以直接加总和

127比较而使用的媒介因素或转化因素。同度量因素在编制综合指数中,有两方面的作用:一是把经济意义上不能相加的指标数值过渡为经济意义上可以相加的数值,即同度量的作用;二是具有权衡轻重的作用,即权数的作用。4随机变量X的分布函数有什么意义?随机变量X的数学期望和方差的实际意义是什么?答:若已知X的分布函数,则知道X落在任一区间(x1,x2]上的概率。从这个意义上说,分布函数完整地描述了随机变量的统计规律性。分布函数是一个普通的函数,正是通过它,才能用数学分析的方法来研究随机变量。数学期望是描述随机变量平均值的数字特征,方差是描述随机变量偏离程度的数字特征。随机变量的数学期望从本质上体现了随机变量X取可能值的真正的平均值,反映随机变量平均取值的大小。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。三、计算与分析题(本题包括1-3题共3个小题,第1小题15分,第2小题20分,第3小题15分,共50分)。1.试填充下表空栏中的数据。

128解:根据2001年的增长绝对量可以计算出2001年的产量:95.2+4.8=100(百万平方米)根据2002年的发展速度可以计算出2002年的产量:100×104.0%=104(百万平方米)根据2003年的增长速度可以计算出2003年的产量:104×(1+5.8%)=110.032(百万平方米)根据2005年的增长绝对量可以计算出2005年的产量:115+7.0=122.0(百万平方米)已知2000~2005年各年的产量,可以求各年的增长绝对量、发展速度及增长速度:这一年的增长绝对量=这一年的产量-上一年的产量这一年的发展速度=这一年的产量/上一年的产量这一年的增长速度=这一年的发展速度-1计算结果见下表:

1292据某市场调查公司对某市80名随机受访的购房者的调查,得到了该市购房看重本地人购房比率p的区间估计,在置信水平为90%时。其估计误差为0.08。则:(1)这80名受访者样本中为本地购房者的比率是多少?(2)若置信水平为95%,要保持同样的精度进行区间估计。需要调查多少名购房者?(注z0.05=1.645,z0.025=1.96)解:(1)由比例区间估计的公式得:P的区间估计为[67%,83%]或[17%,33%]。(2)根据估计总体比例时样本容量的确定公式:

130得:3罐子中有10颗围棋子,3颗白子,7颗黑子,如果无放回地每次从中任取一颗。直到取得黑子为止。所取得的白子数是一个随机变量,写出这个随机变量的分布列,并计算它的期望和方差。解:用随机变量X表示取得的白子数,则X可能的取值有0,1,2,3。则根据题意有:X=0表示第一个取得的是黑子,结束,P(X=0)=7/10;X=1表示第一个取得的是白子,第二个是黑子,结束,P(X=1)=(3/10)×(7/9)=7/30;X=2表示第一、二个取得的是白子,第三个是黑子,结束,P(X=2)=(3/10)×(2/9)×(7/8)=7/120;X=3表示前三个取得的是白子,第四个是黑子,结束,P(X=2)

131=(3/10)×(2/9)×(1/8)×(7/7)=7/120;所以随机变量的分布列为:EX=0×(7/10)+1×(7/30)+2×(7/120)+3×(1/120)=3/8

1322016年安徽大学432统计学[专业硕士]考研真题

133

134

135

136

137

138

139

140

141

142

143

144

145

1462016年安徽大学432统计学[专业硕士]考研真题及详解一、单项选择题(本题包括1~30题共30个小题,每小题2分,共60分,在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题卡相应的序号内)1某组距式变量数列的末组为开口组,下限为300,其邻组组中值为270,其末组组中值为()。A.230B.330C.540D.570【答案】B【解析】组中值是指组距数列每组下限与上限之间中点位置上的数值,组距是一个组的上限与下限的差,组距=上限-下限,组中值=(上限+下限)÷2=上限-组距/2=下限+组距/2。对于开口组的组距和组中值的确定,一般以其邻近组的组距为准。末组的临组组距=2×(300-270)=60,所以末组组中值=下限+邻组组距/2=300+60/2=330。2对于右偏分布,均值、中位数和众数之间的关系是()。

147A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数【答案】A【解析】如果数据的分布是对称的,众数、中位数和平均数必定相等,即众数=中位数=平均数;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:平均数<中位数<众数;如果数据是右偏分布,说明数据存在极大值,必然把平均数拉向极大值一方靠,此时众数<中位数<平均数。3描述定性数据的两种最常用的图示法是()。A.条形图和饼图B.散点图和饼图C.散点图和条形图D.条形图和茎叶图【答案】A【解析】定性数据包括分类数据和顺序数据,可以描绘出它们各类的比例,常用饼图和条形图表示。饼图主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用;条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。

1484某企业有两个车间,第一车间平均工资为85元,第二车间平均工资为96元,如果第一车间的工人数增加50%,第二车间人数不变,那么该企业的平均工资会()。A.增加B.减少C.不变D.不能肯定【答案】B【解析】设第一车间的工人数为n1,第二车间的工人数为n2,则原来的平均工资为后来的为故该企业的平均工资减少。5中心极限定理表明,如果容量为n的样本来自于正态分布的总

149体,则样本均值的分布为()。A.非正态分布B.只有当n<30时为正态分布C.只有当n>30时为正态分布D.正态分布【答案】D【解析】中心极限定理的定义为:从任意一个均值为μ、方差为σ2的总体中随机抽取一个样本容量为n的样本,当样本量n足够大时,样本均_值x近似服从均值为μ、方差为σ2/n的正态分布。如果总体服从正态分布,则样本均值的抽样分布也服从正态分布;如果总体不服从正态分布,则大样本情况下均值的抽样分布仍然服从正态分布。6一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤。体重在55~65公斤之间的男生占()。A.60%B.68%C.90%D.95%【答案】B【解析】根据题意可知,(55,65)=(60-5,60+5)=(μ-σ,μ+σ)。根据3σ原则,数值分布在(μ-σ,μ+σ)中的概率为

1500.6826。7采用抽样方法调查某大学学生的消费支出,如果不易获得全校学生的名单,比较合适的抽样方法是()。A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样【答案】B【解析】整群抽样是将总体中若干个单位合并为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查的抽样方法。由于全校学生的名单不易获得,用整群抽样时只需要中选群的抽样框,而不必要求包括所有单位的抽样框。8在置信水平不变的条件下,要缩小置信区间,则()。A.需要增加样本容量B.需要减少样本容量C.需要保持样本容量不变D.需要改变样本统计量的抽样标准差【答案】A【解析】当置信水平固定时,置信区间的宽度随样本量的增大而减小,换言之,较大的样本所提供的有关总体的信息相比较小的样本要

151多,估计的准确性也要高一些,置信区间的长度也越短。9在其他条件不变的情况下,要使估计时所需的样本容量小,应该()。A.提高置信水平B.降低置信水平C.使置信水平不变D.使置信水平等于1【答案】B【解析】样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大。10在假设检验中,当原假设正确时拒绝原假设,所犯的错误称为()。A.第Ⅰ类错误B.第Ⅱ类错误C.取伪错误D.取真错误【答案】A【解析】对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述,这种判断面临着犯错误的可能。所犯的错误有两种类型,第Ⅰ类错误是原假设H0为真却被我们拒绝

152了,也称为弃真错误;第Ⅱ类错误是原假设为伪我们却没有拒绝,也称为取伪错误。11当备择假设为H1:μ<μ0,此时的假设检验为()。A.双侧检验B.右侧检验C.左侧检验D.显著性检验【答案】C【解析】在显著性水平α下,检验假设H0:μ≥μ0;H1:μ<μ0的假设检验称为左侧检验,在显著性水平α下,检验假设H0:μ≤μ0;H1:μ>μ0的假设检验称为右侧检验,这两种检验统称为单侧检验;在显著性水平α下,检验假设H0:μ=μ0;H1:μ≠μ0的假设检验称为双侧假设检验12与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。A.提高B.降低C.等于0D.等于1【答案】B【解析】总体均值的t检验或z检验,一次只能研究两个样本,如果

153要检验多个总体的均值是否相等,那么做这样的两两比较将十分烦琐,共需进行C2次不同的检验。如果α=0.05,每次检验犯第Ⅰ类错误的概n率都是0.05,作多次检验就会使犯第Ⅰ类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而犯第Ⅰ类错误的概率就会小很多。13有交互作用的双因素方差分析是指用于检验的两个因素()。A.对因变量的影响是独立的B.对因变量的影响是有交互作用的C.对自变量的影响是独立的D.对自变量的影响是有交互作用的【答案】B【解析】在双因素方差分析中,如果两个因素对因变量的影响是相互独立的,这时的双因素方差分析称为无交互作用的双因素方差分析;假定两个因素对因变量的影响是独立的,但如果两个因素搭配在一起会对因变量产生一种新的效应,就需要考虑交互作用对因变量的影响,这就是有交互作用的双因素方差分析。14在方差分析中,用于检验的统计量是()。A.χ2统计量B.t统计量C.z统计量

154D.F统计量【答案】D【解析】在方差分析中,为构造检验的统计量,需要计算三个误差平方和:总平方和、组间平方和、组内平方和。总平方和(SST)的自由度为n-1,其中n为全部观测值的个数;组间平方和(SSA)的自由度为k-1,其中k为因素水平(总体)的个数;组内平方和(SSE)的自由度为n-k。由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度,SSA的均方和SSE的均方分别记为MSA、MSE,将上述MSA除以MSE,即得到所需要的检验统计量F。当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即15如果两个变量的协方差等于0,则二者的相关系数必定是()。A.正相关B.负相关C.低度相关D.不相关【答案】D【解析】两个随机变量的相关系数可以通过方差和协方差定义:

155r的取值范围在-1~1之间,即-1≤r≤1。r>0表明X与Y之间存在正线性相关关系;r<0表明X与Y之间存在负线性相关关系;r=0表明X与Y之间不相关;|r|=1表明X与Y之间为完全相关关系。本题中当Cov(X,Y)=0时有r=0,故X与Y之间不相关。16按照线性回归的基本假定,自变量应当()。A.与残差不相关B.与随机扰动μt不相关C.与因变量Y不相关∧D.与样本条件均值Yt不相关【答案】B【解析】线性回归模型有三个基本假定:①误差项(随机扰动项)ε是一个期望值为0的随机变量,即E(ε)=0;②对于所有的x值,ε的方差σ2都相同。这意味着对于一个特定的x值,y的方差也都等于σ2;③误差项(随机扰动项)ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。假定②即说明自变量与随机扰动项不相关。17若基尼系数为0,表示收入分配()。A.比较平均B.绝对平均

156C.绝对不平均D.无法确定【答案】B【解析】基尼系数定量测定收入分配差异程度,是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。其经济含义是:在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比。基尼系数最大为“1”,最小等于“0”。前者表示居民之间的收入分配绝对不平均,即100%的收入被一个单位的人全部占有了;而后者则表示居民之间的收入分配绝对平均,即人与人之间收入完全平等,没有任何差异。18某企业的产值,每年都增加500万元,则该企业产值各年的环比增长速度为()。A.递增B.递减C.不变D.有增有减【答案】B【解析】环比增长速度是逐期增长量与前一时期发展水平对比的结果。本题中逐期增长量均为500万元。设该企业第一年的初始产值为a万元,则第一年的增长速度为v1=500/a,第i年的环比增长速度为

157当i增大时,vi减小,故各年的环比增长速度是递减的。19已知时间序列各期水平依次为10,24,37,53,65,81,为描述其长期趋势应当拟合()。A.直线方程模型B.指数曲线模型C.二次抛物线模型D.三次曲线模型【答案】A【解析】本题中时间序列各期相比上期的增长量依次为14、13、16、12、16,增量均为正项且在14上下波动,再结合时序图,可知符合直线方程模型。图1时间序列图20与标准正态分布相比,t分布的特点为()。A.对称分布

158B.非对称分别C.比正态分布平坦和分散D.比正态分布集中【答案】C【解析】t分布和标准正态分布均为对称分布;t分布曲线形态与自由度df的大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。21若两个事件A和B同时发生的概率为0,则下列结论正确的是()。A.A和B互斥B.AB是不可能事件C.AB未必是不可能事件D.P(A)=0或P(B)=0【答案】C【解析】由题意可知P(AB)=0,如果是古典概率,P(AB)=0说明AB是不可能事件;但是对于几何概率,AB不一定是不可能事件。例如在数轴上区间[0,1]内任取一点,则取到每一点的概率是0。假设事件A表示[0,1]上的取值在[0,0.1]内,事件B表示取值在[0.1,0.2]内,则有P(AB)=0,但是事件AB有可能发生,只要取值为0.1即可。

15922当任意两事件A与B,有P(A-B)=()。A.P(A)-P(B)B.P(A)-P(B)+P(AB)C.P(A)-P(AB)_D.P(A)+P(B)-P(AB)【答案】C【解析】事件A-B={x|x∈A且x∉B}称为事件A与事件B的差事件,当且仅当A发生且B不发生时,事件A-B发生。因此P(A-B)=P(A)-P(AB)。23设事件A,B,C,D相互独立,则下列事件中不独立的是()。A.与CD_B.A∪B-C与DC.与D.A-B与B∪D-C【答案】D【解析】设事件A1,A2,…,An相互独立,则其中任i个事件之并及交必与其余n-i个事件相互独立;其中任两个事件之差必与其余n-2个____事件相互独立。A项中,,AB与C、D相互独立,故AB与CD_相互独立。B项中,A∪B与C,D相互独立,即A∪B与C,D相互独_立,故A∪B-C与D相互独立。C项中,A-B与C-D相互独立,故

160与相互独立。D项中,A-B与C、D相互独立,A-B与B∪D不相互独立。24设A,B为任意两个事件,且A⊂B,P(B)>0,则下列选项必然成立的是()。A.P(A)<P(A|B)B.P(A)≤P(A|B)C.P(A)>P(A|B)D.P(A)≥P(A|B)【答案】B【解析】设A,B是两个事件,若A⊂B,则有P(AB)=P(A);P(B)≥P(A),0<P(B)≤1。根据条件概率有P(A|B)=P(AB)/P(B)=P(A)/P(B)≥P(A)。25设随机变量X的分布列为则X的分布函数F(x)=P(X≤x)为()。

161A.B.C.D.【答案】A【解析】由分布列可知:①当x<-1时,F(x)=0;②当-1≤x<0时,F(x)=P(X≤x)=P(X=-1)=1/3;③当0≤x<1时,F(x)=P(X≤x)=P(X=-1)+P(X=0)=1/3+1/6=1/2;④当x≥1时,F(x)=P(X≤x)=P(X=-1)+P(X=0)+P(X=1)=1/3+1/6+1/2=1。

16226设F1(x)和F2(x)分别为ξ和η的分布函数,为使F(x)=aF1(x)-bF2(x)是某一随机变量的分布函数,在下列给出的各种数值中应取()。A.a=3/5,b=-2/5B.a=2/3,b=2/3C.a=-1/2,b=3/2D.a=1/2,b=-3/2【答案】A【解析】根据题意有因为F(x)也是某一随机变量的分布函数,有即分析四个选项只有A选项中a-b=1。27设随机变量ξ的密度函数为f(x),分布函数为F(x),若

163f(-x)=f(x),则对任意的实数a,总有()。A.B.C.F(-a)=F(a)D.F(-a)=2F(a)-1【答案】B【解析】由f(-x)=f(x)有即有即f(x)关于原点对称,故有:因此28设随机变量X和Y独立同分布,记U=X-Y,V=X+Y,则随

164机变量U和V必然()。A.不独立B.独立C.相关系数不为零D.相关系数为零【答案】D【解析】由协方差的定义可知:cov(U,V)=cov(X+Y,X-Y)=cov(X,X)-cov(X,Y)+cov(Y,X)-cov(Y,Y)变量X和Y相互独立,故有cov(X,Y)=cov(Y,X)=0。由随机变量X和Y相互同分布可得:cov(X,X)=cov(Y,Y)=DX=DY,所以cov(U,V)=0,故X和Y不相关。29设则随机变量X的数学期望是()。A.0B.1C.0.5D.不存在【答案】C

165【解析】因为级数是发散的,故E(X)不存在。30人的体重为ξ,且Eξ=a,Dξ=b,10个人的平均体重为η,则()。A.Eη=aB.Eη=0.1aC.Dη=0.01bD.Dη=b【答案】A【解析】根据题意,人的体重为ξ,则人的平均体重为Eξ=a。根据抽样分布的中心极限定理,在大样本情况下,若总体X的期望为EX=_μ,方差为DX=σ2,则X~N(μ,σ2/n)。故Eη=a。二、简要回答下列问题(本小题包括1~4题共4个小题,每题10分,共40分)1.一组数据的分布特征可以从哪几个方面进行测度?

166答:一组数据的分布特征可以从以下三个方面进行测度:数据分布集中趋势的测度、数据分布离散程度的测度、数据分布偏态与峰度的测度。(1)集中趋势的测度数据的集中趋势反映数据向其中心靠拢或聚集的程度(位置)。用于测量集中趋势的指标有众数、中位数、分位数、均值、几何平均数、切尾均值等。(2)离散程度的测度离散趋势是指数据远离中心的趋势(分散程度)。用于测量离散程度的指标有极差、内距、方差和标准差、离散系数等。(3)偏态与峰度偏态是数据分布对称性的度量,峰度是数据分布的平峰或尖峰程度(形状)。2简述参数最小二乘估计的基本原理答:最小二乘估计的基本原理是通过使因变量的观测值yi和估计值∧yi之间的离差平方和,即使达到最小来估计模型的未知参数。以一元线性回归模型为例,对于x和y的n对观测值,用于描述其关系的直线有多条,显然,用距离各观测点最近的一条直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。德国科学家卡尔·高斯提出通过最小化观测值与估计值的垂直距离的平方和来估计参数β0和β1,根据这一方法确定模型参数β0和β1的方法称为最小二乘法,它是通∧过使因变量的观测值yi与估计值yi之间的离差平方和达到最小来估计β0

167和β1的方法。3什么是多重共线性,多重共线性对回归分析有哪些影响?答:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。在回归分析中存在多重共线性时将会产生如下问题:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS估计量非有效;(3)参数估计量经济含义不合理,多重共线性可能对参数估计值的正负号产生影响,特别是βi的正负号有可能同预期的正负号相反;(4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外;(5)模型的预测功能失效,变大的方差容易使区间预测的“区间”变大,使预测失去意义。4为什么要引入随机变量?离散型随机变量的函数还是离散型随机变量吗?连续型随机变量的函数还是连续型随机变量吗?为什么?答:(1)引入随机变量是研究现象统计规律性的需要。为了便于数学推理和计算,有必要将随机试验的结果数量化,使得可以使用数学中的理论与方法来研究随机试验,研究和分析其结果的规律性。(2)当函数是博雷尔函数时,离散型随机变量的函数仍是离散型随机变量;连续型随机变量的函数仍是连续型随机变量。证明过程如下:设y=g(x)是连续函数,X为定义在样本空间上的随机变量,令Y

168=g(X),那么Y也是一个定义在同一样本空间上的随机变量。如果X是离散型的随机变量,那么Y也是离散型的随机变量;如果X是连续型的随机变量,那么Y也是连续型的随机变量。三、计算与分析题(本题包括1~4题共4个小题,第1小题、第2小题各10分,第3小题、第4小题各15分,共50分)。1.一家公司在招收职员时,首先要通过两项能力测试。在A想测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?答:标准分位数可以把两组数据中的两个不同均值,不同标准差的数据进行对比,以判定它们在各组中的位置,其计算公式为:Zi=(xi_-x)/s。将数据带入计算得:A项的标准分位数为:ZA=(115-100)/15=1;B项的标准分位数为:ZB=(425-400)/50=0.5。ZA>ZB,故应试者的A项成绩较为理想。2某厂产品的优质品率一直保持在40%,近期技监部门来厂抽查,共抽查了15件产品,其中优质品为5件,在α=0.05水平上能否认为其优质品率仍保持在40%?答:根据题意陈述假设:H0:π=π0,H1:π≠π0。由中心极限定理,二项分布可用正态分布近似,即

169本题中p=5/15=1/3,π0=2/5,n=15,代入计算得检验统计量为落在非拒绝域内,故在α=0.05水平上认为其优质品率仍然保持在40%。3下表中给出Y对于X1、X2回归的结果。要求:(1)该回归分析中样本容量是多少?(2)计算RSS。(3)ESS和RSS的自由度是多少?(4)计算可决系数。

170答:(1)总离差平方和SSR的自由度为n-1,由方差分析表可知n-1=14,故n=15。(2)因变量的总变差平方和SST被分解成两部分:回归平方和SSR与残差平方和SSE,三个平方和之间的关系为SST=SSE+SSR。由表中数据可得SSR=SST-SSA=66042-65965=77。(3)三个平方和所对应的自由度分别为:①SST的自由度为n-1,其中n为全部观测值的个数。②SSR的自由度为k,其中k为自变量的个数。③SSE的自由度为n-k-1。本题中自变量的个数为2,故SSR的自由度为2,SSE的自由度为15-2-1=12。(4)可决系数即多重判定系数,它是多元线性回归平方和占总平方和的比例,计算公式为:R2=SSR/SST,将数据代入计算得可决系数R2=77/66042=0.0011659。4设二维随机变量(X,Y)的联合概率密度函数为试求:(1)E(XY)和DX,DY(2)X和Y是否不相关?答:(1)由

171可得:因为f(x,y)=fX(x)·fY(y),故随机变量X,Y相互独立。根据D(X)=E(X2)-(EX)2,D(Y)=E(Y2)-(EY)2得:D(X)=1/2-4/9=1/18,D(Y)=3/5-9/16=3/80。

172(2)Cov(X,Y)=E(XY)-EX·EY=1/2-(2/3)×(3/4)=0,故X,Y不相关。

1732017年安徽大学432统计学[专业硕士]考研真题(回忆版)及详解一、选择题涵盖内容:1推断统计2集中趋势3概率的统计定义4方差分析(检验对象)5离散趋势6变量类型7统计量的分布(抽样分布)8平均数(中、众、平)

1749回归方差分析那块考了几个小知识点二、简答题1统计数据按计量尺度可分为哪几种类型?不同类型的数据各有什么特点?答:(1)统计数据按计量尺度的分类按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。①分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。②顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。③数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数数据都是数值型数据。(2)不同类型的数据的特点分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。2比较概率抽样与非概率抽样。

175答:(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式主观地从总体中抽出部分单位对其实施调查。(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。3一元线性回归模型中有哪些基本假定?答:(1)因变量y与自变量x之间具有线性关系;(2)在重复抽样中,自变量x的取值是固定的,即假定x是非随机的;(3)误差项ε是一个期望值为0的随机变量,即E(ε)=0;(4)对于所有的x值,ε的方差σ2都相同。这意味着对于一个特定的x值,y的方差也都等于σ2;(5)误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。4简述χ2分布、t分布、F分布及正态分布之间的关系。

176答:(1)随机变量X1,X2,…Xn相互独立,且都服从标准正态分布,则它们的平方和服从自由度为n的χ2分布。(2)随机变量X服从标准正态分布,Y服从自由度为n的χ2分布,且X与Y独立,那么服从自由度为n的t分布。(3)随机变量Y和Z分别服从自由度为m和n的χ2分布并且相互独立,那么服从第一自由度为m,第二自由度为n的F分布。三、计算题1某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.5,6.6,6.7,6.8,7.1,7.3,7.4,7.8,7.8。(1)画出第二种排队方式等待时间的茎叶图。(2)比较两种排队方式等待时间的离散程度。(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。(圣才P52第八题)解:(1)第二种排队方式等待时间的茎叶图如图1所示。叶单位=0.1

177图1第二种排队方式等待时间的茎叶图(2)第二种排队方式等待时间的均值为:标准差为:_第一种排队方式的均值x1=7.2分钟,标准差s1=1.97分钟,则离散_系数v1=s1/x1=1.97/7.2=0.274;_第二种排队方式的离散系数v2=s2/x2=0.71/7=0.101。由于v1>v2,因此第二种排队方式的离散程度较小。(3)由于第二种排队方式的平均等待时间小于第一种排队方式,并且离散程度较小,所以会选择第二种排队方式。2甲、乙两粒种子,发芽率分别为0.8和0.7,在两粒种子中各随机

178抽取一粒,两粒都发芽的概率和至少有一粒发芽的概率。解:设A、B分别表示取自甲、乙两批种子种的某粒种子发芽这一事件,即有P(A)=0.8,P(B)=0.7。由于两粒种子是否发芽互不影响,则这两粒种子发芽的概率为P(AB)=P(A)×P(B)=0.56至少有一粒种子发芽的概率为1-(1-P(A))×(1-P(B))=1-0.2×0.3=0.943造灯泡厂的质量标准时平均使用寿命为1200小时,标准差为300_小时,抽取100个作为样本,x=1245,能否说明该厂的灯泡质量显著地高于规定的标准?(1)写出H0和H1。(2)假设检验,并说明可能会犯的错误;(3)若要拒绝H0,样本平均寿命至少要达到多少,此时会犯哪种错误。解:(1)H0:μ≤1200,H1:μ>1200(2)检验问题属于大样本均值检验,因此构造检验统计量如下:取α=0.05,拒绝域为z>zα=z0.05=1.645。因为z=1.5<1.645,故落入非拒绝域,则认为没有充分的理由认为该厂的灯泡质量显著地高于规定的标准。此时容易犯取伪错误,即在原假设为假时,我们没有拒绝

179原假设。(3)由上题的分析可知,拒绝域为z>zα=z0.05=1.645,这要求:则有:这表明只有当样本均值达到1249.35时,我们才能有充分的理由认为该厂的显像管质量显著的高于规定的标准,这时可能犯弃真错误,即原假设为真,但是我们拒绝了原假设,可能犯错误的概率为0.05。4(1)补全数据(2)五年间平均每年的增长速度是多少?超过平均增长速度的年份有哪些?解:(1)计算结果如下:

180(2)用五年间平均每年的增长速度是:故超过平均增长速度的年份有2003、2004年。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
最近更新
更多
大家都在看
近期热门
关闭