医学高级统计学_第九章因子分析.pdf

医学高级统计学_第九章因子分析.pdf

ID:50925717

大小:4.07 MB

页数:88页

时间:2020-03-08

医学高级统计学_第九章因子分析.pdf_第1页
医学高级统计学_第九章因子分析.pdf_第2页
医学高级统计学_第九章因子分析.pdf_第3页
医学高级统计学_第九章因子分析.pdf_第4页
医学高级统计学_第九章因子分析.pdf_第5页
资源描述:

《医学高级统计学_第九章因子分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第九章因子分析姜晶梅流行病与统计系北京协和医学院基础学院2018.06.07内容9.1.1正交因子模型9.1.2正交因子模型的参数估计9.1.3方差最大正交旋转9.1.4因子得分9.1.5应用实例多元线性回归模型yXXXiiipipi01122EYX

2、XX011pp?2var(

3、YX)主成分ZaXaXaXaX,11111212pp1ZaXaXaXaX,22121222pp2ZaXaXaXaX,pp1p12p2ppp3将该坐标系按逆时针方

4、向旋转某个角度变成新坐标系,这里Z1是Z椭圆的长轴方向,Z是椭圆的短12Z轴方向。旋转公式为:2ZXXcossin112ZsinXXcos212矩阵表达形式为:ZX11cossinAX二维平面的样本点得散布图ZXsincos22cossin其中,A为旋转变换矩阵,它是正交矩阵,sincos即有A´=A-1或A'A=I。旋转变换是正交变换主成分建模的基本思想设XXX(X,,p,)EX(),()DX.为维随机向量,12pZa

5、XaXaXaX,111112121ppZaXaXaXaX,221212222pp()0ZaXaXaXaX,I0ppppppp1122ZX11aa111pZX22'12pZAX......1aap1pp1ZXpp12p主成分求解过程1、将原始数据标准化实际问题中往往协方差矩阵∑未知,这时可以用样本协方差阵来代替。同时由于指标的量纲不同,而将原始数据标准化。

6、1SRXXn实际工作中,也可以计算样本相关阵,从而得到特征值及相对应下的特征向量并进行主成分分析2、计算特征根与特征向量▲解特征方程RI-0,可用Lagrangemultiplier乘子法求解并使其按大小顺序排列。La(,)aa(aa1)11111,012p▲分别求出对应于特征值i的特征向量,paip2i(1,2,,)要求ai1,即aij1j1ZaXaXaXaX,11111212pp1ZaXaXaXaX,22121222pp2ZaXaXaX

7、aX,pp1p12p2ppp因子分析引言因子分析的形成和早期发展一般认为是从CharlesSpearman在1904年发表的文章开始.他提出这种方法用来解决智力测验得分的统计分析.因子分析在心理学、社会学、经济学等学科都取得成功的应用。初学因子分析的人最大的困难就是理解它的模型。我们先看几个例子。举例1:某学校33个学生6门功课的相关矩阵文学法语英语数学美术音乐.x1x2x3x4x5x6文学x11这6门课的成绩法语x20.831由哪些因子决定?英语x30.780.671数学x40.700.670.641美术x50.660.650.54

8、0.541x60.630.570.510.510.401音乐1904年CharlesSpearman指出,如果第i个变量(第i门功课,i=1,2,…,6)上的分数由两部分组成的xaFiii那么各门功课相关的“效应”就可以被说明.其中F是对所有变量都起作用的公因子,i是第i个变量所特有的,即每门课程的考试成绩可以看作由一个公因子(智力因子)和一个特殊因子之和组成.这是最早的最简单的因子模型.举例2林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能

9、项目为:100米跑(X1),跳远(X2),铅球(X),跳高(X),400米跑(X),110米跨栏(X),铁饼3456(X),撑杆跳高(X),标枪(X),1500米跑(X)。经标准化后78910所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型:xaFaFaFaFi,1,2,,10iiiiiii11223344其中FFFF12,3,,4表示四个因子,称为公共因子,aij称为xi在因子F上的载荷,ji

10、是xi的均值,i是x不能被四个公共因子解i释的部分,称之为特殊因子。因子分析的主要目的寻求基本结构,简化原变量的协方差结构,将具有错综复杂关系的对象(变量或样本)综合为少数几个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。