信息分析方法__分类分析方法

信息分析方法__分类分析方法

ID:44037365

大小:897.43 KB

页数:37页

时间:2019-10-18

信息分析方法__分类分析方法_第1页
信息分析方法__分类分析方法_第2页
信息分析方法__分类分析方法_第3页
信息分析方法__分类分析方法_第4页
信息分析方法__分类分析方法_第5页
资源描述:

《信息分析方法__分类分析方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第五章分类分析方法第一节列联表分析法一、一维多项分类分析这种将同一事物仅按某种特性(标志)分为若干(多个)类型,反映类型间是否有显著差异的分析方法称为一维分类多项分析。1、基本原理将总体按照某种特性分为九,A2,……九k个类型,总体中属于k个类型的比例为m,P2,……,%现从总体中随机抽查n个样本单位,其中属于Ai类有m个,i=l,2,…k。原假设Ho:pi=P2=…=Pk统计量£=导切一因%)]2=yh-^]2t=iE(n)幺明E(nJ为属于Ai类的期望频数,Pi为属于Ai类的样本频率。若讥心一1),则拒绝仏,即k个类型之间有显著差异;若才乙Z^-1),则接受山,即k个类型之间

2、无显著差异。2、例题例1某信息咨询公司受委周查了解顾客对甲、乙、丙三种品牌矿泉水的喜好程度,随机观察了150名购买者的购买情况,并作如下统计。品牌甲乙丙人数615336问顾客对这三种品牌矿泉水的喜好是否存有差异?解本题是一维三项概率分布。令Pl、P2.P3分别表示顾客喜好甲.乙、丙品牌的比例,若顾客对这三种品牌矿泉水的喜好没有差异,则意味着顾客中喜好每种品牌的概率均为1/3,因此,可作假设Ho:Pl=p2=pJ=l/3n】=61,n2=53>m=36,n=150同理E(n^)=E(喝)=50505050'632厂?k”研(61—50):(53一5叩

3、吐5研此例中,k=3,当a=0

4、.05时£W-1)=4k(2)=5・991由于*=6.52A5.991,拒绝乩,即认为顾客对三种品牌的矿泉水喜好确实是有差异的。二、列联表分析(ContingencyTableAnlysis)按两个及以上特性(标志)对同一事物进行分类,每一特性将事物分为若干个组,利用这样的数据分析特性之间有无关系,称为多维多项分析,由于它常借助于列联表进行,所以又称为列联表分析。列联表主要用于判断定性变量之间是否存在相关关系。下面仅介绍二维多项分析。设特性A可分为r类,i=l,2,……,特性B可分为c类,g为同时具有特性A、B的个体,i=l,…,r;j=l,2,co将分组结果如下表表5-1rxc

5、列联表特性A合计Aia2……AjAc1特1性1BBinnrii23nicni.b2n2iF122n2cn2.Brn『2n「jm.合计n.in.2n.jn若用Pij表示同时属于b和Aj类的概率(即联合概率),以表示以特性A分类的一维多项概率分布(边际概率分布),厲•表示以B分类的一维多项概率分布(边际概率分布),则多项概率分布表为:表5-2多项概率分布特性A合计Aia2AjAc!特性B•BiPnP12Pij……PicPl.b2P21P22P2jp2cPl•••BrPrlPr2PrjPrePr.合计P.lP.2•…IPjP.O1若特性A与特性B不具有相关性,则认为两个分类是独立的,

6、因此可作原假设:Ho:Pg—PirZ/(即两个分类是独立的)可以证明,在“很大并且E(®)>5时候,根据Pearson定理则统计量rc/=!J=1%—Egj)]2Eg,l)(c—1)]式中,期望频数由于、未知,Pi.频数为p.j=nj/n,且H°成立时E(〃u)=nPii常用估计值代替,则理论期望Eg=rip©=riPi.P.jAEGij)=nin.j/n给定显著性水平,当力2>/:[(—l)(c—l)]时,拒绝H。,属性A、B不独立,存在相关关系;/<力[0—1)0—1)]接受H。,属性A、B相独立,不存在相关。[例2]某市商业系统为提高商业的服务质量,对本市的四大商场进行调查

7、,征求顾客意见,共收回有效问卷443张,每张问卷对某一商场按三种服务质量(优、中、差)评价,其结果用3x4列联表表示出来,见表5—3。试分析对四个商场的服务质量评价是否一样。表5-3商场合计ABCD优81464967243中38333926136差257201264合计14486108105443解:Ho:四个商场服务质量评价一样;首先,在H()成立的条件下计算期望频数估计表,结果如下表所示.ABCD合计优7947.259.257.6243中44.226.423.233.2136差20.812.415.615.264合计14486108105443E(®2)243x86443=4

8、7.2上表中,n=443,E(/i.)>5.统计量j=ij=i(81—79)2十(46—47.2)279~472-(12-15.2)2=13.215.2给定6Z=0.05,查表得加05【(4-D(3-1)]说a(6)=12.59由于Z2>Zo.o5(6),因此在0-05显著性水平上计算所得结果否定H。,即认为四个商场的服务质量的评价结果存在显著不同。3、SPSS软件的实现操作过程如下:■选择Data—WeightCases,进入WeightCases对话框。把“频数[f]”放入F

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。