多元统计分析第十章 属性数据的统计分析

多元统计分析第十章 属性数据的统计分析

ID:18922247

大小:700.00 KB

页数:25页

时间:2018-09-27

多元统计分析第十章 属性数据的统计分析_第1页
多元统计分析第十章 属性数据的统计分析_第2页
多元统计分析第十章 属性数据的统计分析_第3页
多元统计分析第十章 属性数据的统计分析_第4页
多元统计分析第十章 属性数据的统计分析_第5页
资源描述:

《多元统计分析第十章 属性数据的统计分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第10章属性数据的统计分析10.1列联表的独立性分析10.1.1实例列联表通常是用来描述两个及两个以上变量在各自不同的取值(或属性)组合水平上的观测频数数据,它常与定性变量相联系。通过对列联表的分析,可以了解这些变量之间的依赖关系。例10.1在一个有三个主要大型商场的商贸中心,调查479个不同年龄阶段的人首先去三个商场中的哪一个,结果如表10-1所示。表10-1商场调查数据年龄段(岁)商场1商场2商场3总和≤3031~50>51总和8091412127086381944515107019519289476

2、那么通过对这个数据列表的分析,我们希望知道顾客对首先选择去什么样的商场与顾客的年龄段是否有关。可以看到,表中只有两个变量,这样的列联表称为二维列联表。例10.2下表给出了一个假设的某大学毕业生的专业M(文科、理工科),性别G及毕业后工作的收入I(高、低)为变量的三维列联表,结果如表10-2所示。表10-2大学毕业生调查牙刷专业(M)性别(G)收入(I)低高文科理工科男女男女12018080208012032080则根据这样的含有三个变量(专业、性别和收入)的列联表,我们可以观察这些变量之间的关系,这样的列

3、联表称为三维列联表。10.1.2定性变量与列联表对定性变量的观测,一般是对它们在不同水平组合上的频数的记录,这里我们将定性变量所描述的不同状态称为该定性变量的水平。我们用表示定性变量,用表示相应的水平。假设有n个随机实验的结果按照两个变量和分类,取值为,取值为,将变量和的各种情况的组合用一张列联表表示,称列联表,如表8-3所示。其中表示取及取的频数。,其中:25表10-3变量频数表BA…总和总和…类似的当涉及三个定性变量时,观测的频数可用三维列联表给出,若还用上面的表示方式,则需要一个三维立体表,但这样通

4、常用起来不方便,所以一般是采用象例10.2的方式把三维列联表给出。10.1.3二维列联表的独立性检验二维列联表的两个变量和可视为离散型随机变量,取值分别和,以表示取及取的概率,通常称为格子概率,以分别表示和的边缘概率。则对于二维列联表,变量和的联合及边缘分布列如表10-4所示。表10-4变量联合及边缘分布列BA…总和总和…1其中这时检验变量和是否独立等价于检验假设如果为真,则在次观测中事件发生的理论频数为25当较大时,理论频数与表10-3中相应的观测频数的差异对,均不应很大,为此,我们用(10.1)来描述

5、理论频数与相应的观测频数的总差异量。当为真时,的值应较小,所以,当的值显著偏大时,就拒绝,也就是认为和不独立。但是在实际中,由于均未知,则我们采用相应的观测概率分别作为概率的估计()。这样,将概率的估计代入(10.1),则可以得到统计量:(10.2)理论上可以证明,当为真时,渐近服从自由度为分布,一般的要求,即每个单元格的频数不少于5。如果值过大,或值很小,则拒绝原假设,认为行变量和列变量存在关联。这种关联并没有指出两变量之间的相关或其他特殊的关系,所以称为一般关联。例10.3(续例10.1)根据例题10

6、.1所给的数据以及所表示的列联表,为了探讨两个变量之间的关系,不妨给出原假设:这两个变量是相互独立的。我们只要将表格中相应的频数代入到式子(10.2),则就可以得到相应的值,利用渐近服从自由度为分布,就可以根据分布表查出是否在水平下拒绝原假设,我们看看如何利用SAS语言来解决这样的问题。为了得到不同年龄段的顾客与他们先去哪一个商场这样两个变量之间的关系,则我们可以利用SAS语言中关于列联表检验的语言PROCFREQ来求出值,则如下所示:dataclient;doi=1to3;doj=1to3;inputf

7、@@;output;25end;end;cards;807045918615413810;run;procfreq;weightf;tablesi*j/chisq;run;其中用i=1,2,3分别表示顾客的年龄段为≤30,31--50,>51;用j=1,2,3分别表示顾客首先去的商场为商场1,商场2,商场3。则运行程序可以得到下面的结果:TABLEOFIBYJIJFrequency‚Percent‚RowPct‚ColPct‚1‚2‚3‚Totalƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒ

8、ƒƒƒƒƒƒƒˆ1‚80‚70‚45‚195‚16.81‚14.71‚9.45‚40.97‚41.03‚35.90‚23.08‚‚37.74‚36.08‚64.29‚ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ2‚91‚86‚15‚192‚19.12‚18.07‚3.15‚40.34‚47.40‚44.79‚7.81‚‚42.92‚44.33‚21.43‚ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒ

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。