欢迎来到天天文库
浏览记录
ID:21053209
大小:42.00 KB
页数:4页
时间:2018-10-19
《第四章差量或离散量数(measuresofdispersion)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、社會統計關秉寅第四章差量或離散量數(MeasuresofDispersion)壹、本單元的目標1、說明差量(離散量數)的目的,以及這些量數所傳達的訊息。2、計算及說明IndexofQualitativeVariation(IQV),全距(Range)、四分位差(InterquartileRange)、標準差(StandardDeviation)、以及變異量(Variance)。3、說明如何選擇適當的差量,以及解釋這些量數的意義。4、描述及解釋標準差的數學特性。貳、各種差量 上章所提之算術平均數、中位數、或眾數等,是描述資料之中心或代表性之統計。配合這類統計對資
2、料之描述,我們有另一種統計來描述資料整體之異質性或是變化、變異的程度,這種描述統計即稱之為差量或離散量數。通常是差量愈大時,資料所呈現的異質性或變異程度愈大。兩個樣本的分配可能有同樣的集中量數,但卻有不同的差量。一、TheIndexofQualitativeVariation(IQV)當變數是以名目尺度測量時(nominalvariable),我們可用IndexofQualitativeVariation(IQV)來表示差量。IQV自然也可用在任何次數分配以分組形式呈現的資料上。 IQV的公式是,其中k是類別或組數N是樣本數Σf2是將各類別次數之平方加起來之總
3、和。 IQV基本上是實際觀察到之變異量和依資料可能有之最大變異量之間的比值,其數值是介於0與1中間。當IQV=0時,資料之同質性最高或變化最小,一定是所有個案都集中在一個類別中。而IQV=1時,是全部個案平均的分配在各類別時。二、Range(R)與InterquartileRange(Q) 當變數是Ordinal或Interval-Ratio的測量尺度時,我們可用全距(Range)或四分位差(InterquartileRange)來表示資料之變異量。社會統計關秉寅 Range(R)之計算十分簡單,即資料中之最大數減去最小數。因此,全距就是表示資料分配中
4、最大數與最小數間的距離。但我們知道,最大數或最小數常有可能是極端之數值,且這類的個案可能很少,因此有時最好是以四分位差(Q)來表示差量。 所謂四分位差即將資料依數值大小排列後,找出第一個四分位數及第三個四分位數之數值後(第一個四分位數之數值,表示資料中有25%之件數之數值低於此數值,而第三個四分位數,是有75%之件數低於此數值),計算出兩個四分位之差距。 25%25%25%25%LowQ1Q2Q3HighScore(中位數)ScoreQ=Q3–Q1即Q=Q3-Q1(亦有人將Q定義為Q3-Q1之差距除以2)。所以,四分位差就是兩個四分位差間的距離。
5、三、標準差及變異量(TheStandardDeviation及TheVariance)Range或InterquartileRange雖然簡單明瞭,但是有一很大缺點,就兩種差量都只用到資料兩個數值來表示資料的變異程度,而未能利用所有的資料,來呈現所有分數間的變化情況,也沒有告訴我們資料中之平均變化或代表性之變化程度為何。 一個好的差量,最好能1、用所有之資料; 2、描述資料中各數值和中心值間之平均變化或差異程度(deviation);3、當資料中的數值分配變化程度或異質性程度大時,則測量差異的數值也越大。要符合以上的要求,我們可以將資料中每個數值與平均數相減
6、,也就是計算Σ(Xi-)。這種差距叫做deviations。如果資料的異質性大,則差距的數值也會愈大。雖然,此差距符合以上的要求,但由於這種差距的總和為零,因此我們要設法以此種差距為基礎來設計差量的統計(你是否記得Σ(Xi-)=0?你是否記得社會統計關秉寅Σ(Xi-)2是minimum?)。我們可以取各數值與平均數差距的絕對值,然後求其總和後,再將總和除以資料的件數。也就是計算Σ∣Xi-∣,然後除以N(次數),即。這種方法得出的差量叫做平均差(averagedeviation)或AD。。不過,統計上很少利用此種差量。另一種作法是先得到各差距的平方,然後將所有的平
7、方加起來,再除以資料的件數。以此方法得到的差量叫變異量(variance)。當我們是計算母群體的變異量時,其公式是σ2=如果是計算樣本的變異量時,則公式為s2=另一個與變異量有關的差量是標準差(standarddeviation),其計算方法就是取變異量的平方根。因此,母群體之標準差的公式是σ=,μ是母群體的平均數。樣本的標準差,則是以s=來求得。由樣本數據求得之Standarddeviation,我們是以小寫s來代表,母群體之標準差我們以σ來代表。由公式可知,以標準差來表示的差量,能夠符合上述三個要求,因此是一很重要之描述變項變異性程度統計。(又通常s≒Ran
8、ge/4,為什麼?)標準
此文档下载收益归作者所有