多变量分析-主成份分析

多变量分析-主成份分析

ID:42977186

大小:112.13 KB

页数:11页

时间:2019-09-23

多变量分析-主成份分析_第1页
多变量分析-主成份分析_第2页
多变量分析-主成份分析_第3页
多变量分析-主成份分析_第4页
多变量分析-主成份分析_第5页
资源描述:

《多变量分析-主成份分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基礎統計報告多變量分析-主成份分析系級:統計學研究所一年級姓名:林忻靈學號:M0974402目錄摘要-2-主成份分析的應用-2-主成份分析的理論-3-主成份分析的解釋討論參考文獻摘要主成份分析主要是利用原有的變數組合成新的變數,且新的變數個數比原變數個數來得少,以達到資料縮減的目的,而新變數將盡可能可以解釋原來資料大部分的變異。主成份分析的應用在管理上,為了顧及決策的周延性全面分析問題,常會用一群變數來共同判定一個決策是否應該執行,但這一群變數通常是需要觀測許多變數所得到的;因此,我們希望以一些新的變數(少於舊的變數)來取代這群舊的變數,並且這組新變數應盡可能的

2、反應舊變數的資訊。例如,某公司的財務分析師要分析其公司的財務狀況,找出了100種財務變數的資料,如何將其簡化成少數綜合指標,且這些綜合指標均是原來100種變數的線性組合。又如,某品管工程師想由一堆製程變數的量測資料中找出幾個主要的綜合指標,以顯示製程是否在控制中。另一方面,實務上在進行迴歸分析時,有可能發現其自變數彼此高度相關(資料有多重共線性),導致估計的迴歸參數標準差太大,使得顯著性檢定用的t檢定值明顯縮小,而使得我們得到的整體估計的模型配適度雖然還不錯,但大部分的參數卻都不顯著的結果。利用主成份分析可解決以上之問題,其中主成份分析形成的新變數是原變數的線性

3、組合。主成份分析的理論(Xi%)(xhx2)xX

4、先由二維主成份分析來看:如上圖,新軸為X,,X2*,設新軸X/與X]的夾角為9,則觀測點相對於新的坐標為X:=X}Cos0-^X2SinOo主成份分析就是要找一角度0,使X「的變異數達到最大。理論上,若代入的是X「變異數最大值時之旋轉角度,則計算後之X:及X2水之相關係數為0。我們可歸納幾點如下:1.觀測點投影至X】,X2軸,得原變數之坐標;新軸即X:,X2水稱為主成份,觀測點投影至X,,X?軸所得新值稱為主成份計分(principalcomponentsscores)o2.新變數為原變數的線性組合,且均值保持不

5、變為0。3.X「,X2*的總平方和與原變數X,,X2的總平方和相同。1.X「,X2水的總變異數與原變數X/,X?的總變異數亦相同;即原資料之總變異數在旋轉0後,保持不變。1.X/解釋總變異的百分比一定比任一原始變數尢或&解釋總變數的百分比大。2.新變數的相關係數為0,即X/*,X2*不相關。我們可由二維主成份分析的幾何意義推廣至多維度:設有"個變數,則在"維空間上,新軸xr有最大變異數(表其有最大解釋變異能力);第二個新變數X2水與xr不相關,且火2*有第二大變異數(尚未被xr解釋的變異部分,擁有最大解釋能力);第三個新變數X,與X,,X,都不相關,且X3*有第

6、三大變異數;依此類推,至最多"個新變數X,,X2*,…,X,為止。理論上,主成份分析是欲導出一組新的直交坐標軸使得I.所得新軸(新變數)稱為主成份,觀測點投影至新軸所得新坐標稱為主成份計分。2.新變數為原變數的線性組合。3.第一個新變數可解釋原資料最大的變異數。5.°個新變數彼此不相關。4.第二個新變數可解釋最多第一個新變數未能解釋的總變異,依此類推。主成份分析的解釋主成份分析的目標可公式化如下:时二叫旺+W丿2+•••+%◎<<=W21x,+vv22x2+---+w2/x/?;,其中,、叮二叫”+叫丿2+•••+%»(1)所有主成份之間Xj,刁不相關,由(2)

7、第一個主成份JQ*的變異數最大,第二個主成份X2?欠之,依此類推⑶w/+wJ+・・・+w/=l(使得新變數的尺度固定)(4)+%Wj2+•••+WqW加=0,/Hj(使得Wi,Wj直交或不相關)1.敘述統計之重要元素:若兀/,比之互變異矩陣為23.0909116.4545516.4545521.09091則可知兩變數的相關係數為0.746(即16.455V23.091xV21.091),且總變異數為44」82,可得知七的變異數解釋了52.26%(即23.091.)o44.1822.主成份:想要求出比1,叱2,…,W”等係數,須在W,+•••+w/=1條件下,找一

8、向量w(weight,權重)使其滿足在w,v=l的情形下,使得最大(其中工為互變異矩陣),則此解即為矩陣》的最大特徵值所對應的單位特徵向量。其中,主成份為禹,兀2,•••,◎,的線性組合,且主成份的權重平方和為Io任兩組權重的點積為0。因為p個主成份彼此不相關,故其解釋變異量不重疊(互變異數為0),且新變數變異數的總和等於原始資料的變異數總和。一般而言,p個變數希望只用m個主成份(mvp)來描述原始資料,故主成份是維度化簡的方法;m要如何選取,常依原始資料的特性而定。前m個主成份的變異數加總,可用來量測資料在較低維度(m維)空間上,原來資訊損失的程度。1.主成份

9、計分:決定主成份後,可對

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。