欢迎来到天天文库
浏览记录
ID:42707493
大小:46.50 KB
页数:3页
时间:2019-09-20
《自由度概念深析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、关于“自由度”的几个问题探析李文华内容提要:本文探讨了如下几个相关的问题:什么是“自由度”?怎样计算“自由度”?“自由度”对于统计学有什么作用?关键词:自由度抽样分布假设检验Abstract:Threeissuesthatarecorrelativehavebeendiscussedinthisarticle.Theseissuesare:Whatisdegreeoffreedom?Howtocalculatedegreeoffreedom?Whatisthesignificanceofdegreeoffreedomtostatistics?Keywords:D
2、egreeoffreedom;Sampledistribution;Hypothesistest在统计学中,有一个很难理解的概念——“自由度”(degreeoffreedom)o这里,笔者就如下儿个相关的问题发表一些不成熟的意见,请教方家。一、什么是“自由度”?“自由度”是指当以样本的统计量来估计总体的参数吋,样本中独立或能自曲变化的数据的个数。这个定义町以从如下2个方面來理解:第一,“统计量”(如样本数据的平均数尢、样本数据的标准差、口和宀左通过调查样本的数据人为地计算出來的,而“参数”(如总体均值“、)差5)是被调查的总体所客观存在的,这是两者的区别。⑴在统
3、计学的理论层而上,耍求或者假定统计量是参数的无偏估计,认为二者是相等的(在实际研究中,由丁抽样的偏差,可能导致两者不相等,但对于这种情况,研究者是无法知道的,知道就没有抽样调查的必要了)。在理论假设下,统计量也就和参数一样被看作是客观的、确定的。第二,既然在理论上统计量被要求是确定的,那么在实际层面上,计算统计量的那组数据就不是完全自曲的。这一点很重要,因为“自出度”中“自由”的含义就是相对这个“确定”条件而言的。正是统计量的这种“确定性”限制了与z相关的一组数据的“自由度”,也就是说,一组数据不是可以完全自由取值的,它必须支持“统计量与总体参数相等”的理论假设
4、。这就是“自由度”存在的理由。有必要举例来进一步说明“独立或能口由变化的数据”的含义。在心理、社会等领域的测量或者调杳过程中,研究者设置了一些变量(如智商、收入等),这些变量是随机变量。所谓随机变量是指,在调查总体屮,变量的取值范围及其所对应的频次(两者合起來称为变量的分布)是确定的,但在一次具体的抽样调查中,变量的取值及其所对应的频次则是不确定的,但在大样本的抽样调查中,变量的分布又是能体现总体的特征和规律的。例仁研究者调查某个城市在岗职女工的平均收入,从总体40000万人屮,研究者随机抽取了200人进行调查。在这个例子屮,总体40000个在岗女工的收入的平均
5、数是总体参数,是客观的、确定的,尽管研究者不知道。通过随机抽样和问卷调查,研究者获得了200人的收入的数据。运用这组数据可以算出样木的平均数,它是统计量。由于在理论上要求统计量与参数相等,所以这200个数据屮只冇199个数据可以“自由”变动,所以,这组数据在求平均数这个统计量时的自由度就是:K=200-1=199o笫三,在上面的例子中,研究者只抽了一个200人的样本,而在实际层面,这200人的收入是确定的,因为每个被调查者只有一个确定的收入。既然这样,“199个数据可以自由变动”是什么意思呢?这需要回到理论上去回答。在理论上,从20000人中随机抽取200人冇C
6、囂0。种抽取方法,也就是说,在理论上研究者可以得到c芻oo个不同的、样本容量均为200人的样本,这个数据量是很大的(没有必要确切知道它的值)。这样,在理论上就存在很多组调查数据(虽然研究者确实只调查了一个200人的样木,也只获得了一组整据),每组都有200个数据。每组数据在理论上都冇对应的统计量(如平均数疋),正是这些统计量的分布,构成了统计学屮所说的抽样分布,它是基础统计学的核心内容。所以,仅仅在理论上,这200个数据屮的199个数据是可以随不同样本而变化的、自由的。当然,话说冋来,这种自由并非是绝对的,它们也只能在总体的取值范围内变动,例如,关于“收入”这个
7、变量的取值就不可能为负值。第四,“自由度”是谁的?从前面的分析中可以知道,“自由度”产生于这样的背景下:运用一组数据來求“统计量”。离开“一组数据”就不可能冇“统计量”,不计算“统计量”,“一组数据”就失去了科学的价值。所以,“自由度”应该是“统计量”和“一组数据”所共同拥有的。当然,为了方便,我们说“统计量的自由度”或者“一组数据的自由度”也都是可以接受的。二、如何计算“自由度”?自由度的大小与计算统计量时的确定条件的数目成反比,计算某个统计量的口由度,原则上是用数据的个数减去“确定”条件的个数。但说起来容易算起来难。常见的统计量有平均数〒、样本标准差s、M直
8、、X2(卡方)值、F值等
此文档下载收益归作者所有