欢迎来到天天文库
浏览记录
ID:44510649
大小:166.67 KB
页数:6页
时间:2019-10-22
《文科概率与统计基础知识》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、概率与统计一、统计1.三种抽样方法的比校类别共同点特点相互联系适用范围简单随机抽样①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再放回,即不放回抽样.从总体屮逐个抽取.总体个数较少.系统抽样将总体平均分成几部分,按预先制定的规则在各部分中抽取1个个体.系统:在起始部分取样时,采用简单随机抽样,其余部分等距抽。分层:各层抽样时,采用简单随机抽样或系统抽样(层的容量大时对用系统抽样).总体个数较多.分层抽样将总体分成儿层,按各层个体数之比抽取.总体由差异明显的几部分组成.2.常用的统计图表:一“表”(频率分布表);两“图”(频率分布直方
2、图和茎叶图)(1)频率分布直方图①小长方形的面积二组距X频率=频率;②各小长方形的面积之和等于h③小长方形的高=频率丽,所有小长方形的高的和为【注意】直方图的纵轴(小长方形的高)一般是频率除以组距的商(而不是频率〉,横轴一般是数据的大小,小长方形的而积表示频率.⑵茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.1.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征样本数拥频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率
3、分布直方图划分成左右两个面积相等的分界线与X轴交点的横坐标平均数样本数据的算术平均数每个小长方形的面积乘以小长方形底边中点的横坐标之和(2)平均数元=—(西+兀2+・••+£)•n方差?=-[(西一X)2+(兀2_元)2+…+(£一元)2].n标准差5=.X)2+g—可2*…*(兀”—元尸].Vn【提醒】标准差、方差越大,数据的离散程度越大,越不稳定.2.变量间的相关关系知识点分析1、线性回归方程:y=bx+ci(x叫做解释变量,y叫做预报变量)刃__«ry(x:-匚)6-亍)y兀必一b=或&=伺K片〜线性回归方程系数公式:<X^(x.-x)2
4、・W:«1A一,一(公式说明:回归直线过样本的中心点(乙y),也就是平均值点.)2、相关系数公式£(辛■可(齐-刃Z丿£(习心)喀(刃-刃23、儿个结论:(1)回归直线过样本的中心点(元,刃.(2)〃>0时,y与兀正相关,散点图呈上升趋势;方vO时,y与尤负相关,散点图呈下降趋势.(3)斜率b的含义(举例):如果回归方程为尸2.5兀+2,说明x增加1个单位吋,y平均增加2.5个单位;如果回归方程为严一2.5x+2,说明兀增加1个单位时,y平均减少2.5个单位.(4)相关系数厂表示变塑的相关程度。范围:
5、/j<1,即一15厂51卜越末,相关性越弓
6、虽。厂>0吋,y与x正相关;厂<0吋,y与兀负相关.(5)相关指数尺2表示模型的拟合效果。范围:R2e[0,1]F越大,拟合效果越好,(这时:残差平方和越小,残差点在带状区域内的分布比较均••匀,带状区域宽度越窄,拟合精度越高).尺2表示解释变量x对于预报变量y变化的贡献率。例如:R2«0.64,表明“x解释了64%的y变化二或者说“y的差异有64%是由x引起的”。(6)线性回归模型y=bx+a+e,其屮幺叫做随机误差。(y是由兀和幺共同确定的)二、概率1.概率的五个基本性质(1)随机事件A的概率:OWP(A)W1.(2)必然事件的概率为I.(
7、3)不可能事件的概率为0.(4如果事件A与事件B互斥(不可能同时发生),则P(A+B)=P(A)+P(B)・⑸如果事件A与事件B互为对立事件(不会同时发生,但一定有一个发生),那么P(A+B)=P(A)+P(B)=1,即P(A)=1—P(B).对立必互斥,(1)特点:①有限性,②等可能性.互斥未必对立.(2)概率公式:P(A)=事件A中所含的基木事件数试验的基本事件总数3.几何概型⑴特点:①无限性,②等可能性.构成事件人的区域长度(面积或体积)试验的全部结呆所构成的区域长度(面积或体积)三、独立性检验(一)知识点分析1、2x2列联表:统计被调查
8、者的两种状态,每种状态又分两种情况的调查结果表.对于性别变量,其収值为男和女两种,这种变量的不同值表示个体所属的不同类別,像这类变量称为分类变量。2、卡方统计量:为了研究事件X与Y的关系,经调查得到一张2x2列联表,如下表所示:Yiy2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d独立性检验原理:也叫假设性检验(类似反证法原理),一般情况下,假设分类变量X和Y之间没有关系,通过计算K?值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1—P),也就是“X和Y有关系”
9、.(表中的k就是K?的观测值,即k=K2)°n{ad-be)(a+b)(c+d)(a+c)(b+d)独立性检验临界值表P(±>Q0.500.400.2
此文档下载收益归作者所有