欢迎来到天天文库
浏览记录
ID:35505072
大小:58.12 KB
页数:4页
时间:2019-03-25
《数理统计学习心得》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数理统计学习心得现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体茯至是无限总体的数量特征。例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根拯样本数拯来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可以用于对总体某些假设
2、的检验,所以又有不同的推断方法,下面就参数估让和假设检验的基本概念及原理简单谈谈。参数估计是根据从总体小抽取的样木估计总体分布屮包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。参数估计包括点估计和区间估计两种方法。点估计是依据样木估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样木的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均
3、值估计总体均值。②最大似然估计法。T1912年由英国统计学家R.A.费希尔捉出,利用样木分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分Z多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一•种严格的区间估计理论。求置信区间常
4、用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。假设检验是抽样推断屮的一项重耍内容。它是根据原资料作出一个总体指标是否等丁•某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出冇关检验的统计量,依据一定的概率原则,以较小的风险來判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。假设检验的一般步骤1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是
5、由抽样误差引起的;H1:样本与总体或样木与样木间存在木质差异;预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作a,通常取a=0.05或a二0.01。2、选定统计方法,由样木观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>a,结论为按a所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果PWa,结论为按所取Q水准显著,拒绝H
6、0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。假设检验应注意的问题1、做假设检验之前,应注意资料本身是否有可比性。2、当差别有统计学意义吋应注意这样的差别在实际应用屮有无意义。冋归分析:应用数学的方法,通过对大量的试验数据进行处理和分析,从而得出正确的反映变量Z间的相互关系的数学表达式,并判断英冇效性。进而根据表达式,根据一些变量的取值去预测或控制另一变量的变化,并分析这些变量对另一变量的影响程度。(强调的是数学模型的建立,且用F检验验证所有
7、自变量与因变量的显著性。用T检验验证模型屮每个自变量单独与因变量的影响显著性。)相关分析:在统计分析屮,对两个及两个以上变量间数量关系的性质、特点、表现形式进行描述、处理的一种专门的统计分析技术。变量之间的不严格、不准确、不稳定的数量依存关系被称为相关关系,相关关系的强弱、疏密、因环境、时间的变化而呈现出一种独特的规律性。相关分析的R的就是探索相关关系的变动规律,并利用相关分析的结果,为回归分析及统计决策提供有力的依据。相关系数只能描述变量间的关系密切程度,不能揭示现彖间的本质联系。相关系数:随机向量的齐个变量Z间线性关系的密切程度
8、。多重共线问题:当白变量Z间存在一定程度的关联,即相关系数在o和1Z间时,回归模型中的自变量就会削弱各自对因变量的影响,在一定程度上影响参数估计值的准确性和稳定性。对多重共线问题的测度:1,自变量的容忍度,以容许度指标表示。容许度=1
此文档下载收益归作者所有