多變量資料分析

多變量資料分析

ID:44277456

大小:470.08 KB

页数:102页

时间:2019-10-20

多變量資料分析_第1页
多變量資料分析_第2页
多變量資料分析_第3页
多變量資料分析_第4页
多變量資料分析_第5页
资源描述:

《多變量資料分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、多變量分析以SAS爲例目錄第一章主成份分析(PrincipalComponentAnalysis)1第一節何爲主成份分析(PCA)1第二節模式2第三節主成份分析法之流程3第四節SAS中之主成份分析(PROCPRINCOMP)6第五節實例應用9第二章因素分析(FactorAnalysis)17第一節何謂因素分析法18第二節模式20第三節因素分析法之步驟22第四節SAS中之因素分析(PROCFACTOR)25第五節實例應用29第三章判別分析法(DiscriminantAnalysis)38第一節判別分

2、析法之意義與用途38第二節SAS中有關判別分析42第三節實例應用43第四章集群分析法(ClusterAnalysis)59第一節槪觀分群分析59第二節討論65第三節SAS中有關集群分析(PROCCLUSTER)66第四節實例應用70第五章路徑分析(PathAnalysis)79第一節基本原理79第二節路徑分析圖80第三節結語80第四節實例應用81第六章典型相關分析(CanonicalCorrelationAnalysis)86第一節線性組合87第二節典型相關係數87第三節典型相關係數之顯著性檢定8

3、8第四節SAS中有關典型相關分析(PROCCANCORR)89第五節分析的基本架構89第六節實例應用91第一章主成份分析(PrincipalComponentAnalysis)每當學年要結朿時,學校老師總是要將學生的成績做一番評估,如何評估呢?以小學爲例,一般學校的科目有:阈語,算術,自然,社會等。每個學生的成績是按各科成績分別加起來的。如將阈語分數加算數分數,自然分數加社會科分數都加起來做爲總合的成績。但是把成績單純地相加起來,這樣行得通嗎?依照各科考試的內容,各科目應當以加權比例來計算分數,怎

4、麼做呢?可以印,力,a3,色等係數大小來做爲加權的依據。例如:印x阈語+a2X算術+心+自然+a4x社會科;這樣一來即是加權過後總合的成績。接著吾人須決定的是加權的比重,這就是主成份分析'上述的加權比重的1次式亦即其主成份(PrincipalComponent)°第一節何爲主成份分析(PCA)對於某一問題同時可以考慮好幾個因素時,我們並不對這些因素個別處理,而是將它們總和起來處理,這就是PCA。實際上主成份分析之主要目的乃是希望用較少的變數去解釋原來資料中的人部份變異,亦即期望能將我們手屮許多相關

5、性很高的變數轉化成彼此互相獨立的變數,能由其屮選取較原始變數個數少,能解釋大部份資料之變異的幾個新變數,也就是所謂的主成份,而這幾個主成份也就成爲我們用來解釋資料的總和性指標。一般探索性硏究(exploratorystudies)考慮的變數都會太多而不易處理。例如,瞭解某產品的消費者特徵,經過調查後也許可得一、二百個變數(特徵),如X•二身高,X?二體重,X3二每月所得,X匸每星期看電視節目的時,硏究者有時候會因變數太多而無法有效的處理。如何利舟這些變數間的相依結構(dependentstruct

6、ure)將這麼多的變數縮減,而還能把原來變數能解釋的變異,由縮減所得的主成份(principalcomponents)^釋?主成份分析就是討論如何透過較少數的主成份(原來變數之線性組合)以解釋共變異數結搆(covariancestructure)(*變異數矩陣能表現原來觀測之變異情形)。主成份是隨機變數之線性組合'亦是一隨機變數'-般用變異數表示其特性。理論上,由p個變數能求得p個主成份,且此P個主成份可再製原來的P個變數所產生的總變異,而人部份的變異,能由較少的q(p)個主成份解釋,如果是這樣的

7、話,這q個主成份所含之情報(information)^乎會與原來p個變數一樣多。因此,以較少數的q個成份取代原來的P個變數,並將含p個變數的n個觀測組成的資料集合(資料矩陣)縮減成只有q個主成份之n個觀測,這種將資料之構面(dimensionality)縮減,稱爲資料之「精減彙總(parsimonioussummarization)」。主成份分析之主要目的就在於資料縮減(datareduction)與解釋(interpretation)°主成份分析首先由K.Pearson(1901)il出,後由H

8、otelling(1933)發展用於分析相關結媾(correlationstructures)。在較多變數的硏究上,主成份分析扮演的角色是一種手段多於目的,即它本身常不是硏究的最後輸出(目的),而是其它分析,例如迴歸分析'因子分析(factoranalysis)'集群分析(clusteranalysis)°而爲什麼要用解釋變異之能力來尋找主成份呢?例如田徑賽裡有所謂的十項全能項目。某人做1000公尺、400公尺、1500公尺、110公尺高欄、跳遠、跳高、撐杆跳、鉛球、標槍以及鐵餅等

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。