《分类数据分析》PPT课件

《分类数据分析》PPT课件

ID:46952895

大小:1.71 MB

页数:45页

时间:2019-12-01

《分类数据分析》PPT课件_第1页
《分类数据分析》PPT课件_第2页
《分类数据分析》PPT课件_第3页
《分类数据分析》PPT课件_第4页
《分类数据分析》PPT课件_第5页
资源描述:

《《分类数据分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第九章分类数据分析第九章列联分析变量之间的关系:1.定性变量之间的关系2.定性变量与定量变量之间的关系.3.定量变量与定量变量之间的关系.数据的类型与列联分析数据定量数据(数值型数据)分类数据(品质数据)离散数据连续数据列联分析分类数据分类(品质)的随机变量的结果表现为类别例如:性别(男,女)各类别用符号或数字代码来测度使用定类或定序尺度你吸烟吗?1.是;2.否你赞成还是反对这一改革方案?1.赞成;2.反对对分类数据的描述和分析通常使用列联表可使用检验交叉分组一分公司二分公司三分公司四分公司合计赞成该方案687557792

2、79反对该方案32753331141合计10012090110420百分比分布(概念要点)条件频数反映了数据的分布,但不适合进行对比为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布行百分比:行的每一个观察频数除以相应的行合计数(fij/ri)列百分比:列的每一个观察频数除以相应的列合计数(fij/cj)总百分比:每一个观察值除以观察值的总个数(fij/n)7包含百分比的列联表行百分比列百分比总百分比百分比分布一分公司二分公司三分公司四分公司合计赞成该方案24.4%26.9%20.4%28.3%66.4%68.0%6

3、2.5%63.3571.8%—16.2%17.8%13.6%18.8%—反对该方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合计23.8%28.6%21.4%26.2%100%总百分比列百分比行百分比拟合优度的检验.定性变量间独立性的检验某百货公司的电器部下半年各月洗衣机的销售数量如下:该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的,也就是说各月中的销售数量的差别可以归结随机原因,这样可以为以后的进货提供依据,要求0.05的显著性水平

4、进行检验.月份789101112合计销售量(台)271815243630150观点:不赞成观点:赞成合计男女231835475865合计4182123这些变量中每个都有两个或更多的可能取值。这些取值也称为水平;比如观点有两个水平,性别有两个水平等。12行变量和列变量的关系如分析法院判处死刑是否与被告肤色有关。判刑被告死否白人19141黑人17149一分公司二分公司三分公司四分公司合计赞成该方案68755779279反对该方案32753331141合计10012090110420【例】一个集团公司在四个不同的地区设有分公司,现该集

5、团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取420个样本单位(人),了解职工对此项改革的看法,调查结果如下表拟合优度检验拟合优度检验-----一致性检验统计量实际频数期望频数687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合计:3.0319某百货公司的电器部下半年各月洗衣机的销售数量如下:该电器部经理想了解洗衣机的销售

6、数量是否在各月是均匀分布的,也就是说各月中的销售数量的差别可以归结随机原因,这样可以为以后的进货提供依据,要求0.05的显著性水平进行检验.月份789101112合计销售量(台)271815243630150H0:洗衣机销售服从均匀分布H1:不服从均匀分布.拒绝H0月份789101112合计销售量(台)271815243630150期望分布252525252525独立性检验19观测值的分布观测值分布表观点:不赞成观点:赞成合计男女231835475865合计4182123观察值的分布(列联表)一分公司二分公司三分公司四分公司合计

7、赞成该方案68755779279反对该方案32753331141合计100120901104200.6640.336100期望频数的分布(概念要点)假定行变量和列变量是独立的一个实际频数fij的期望频数eij,是总频数的个数n乘以该实际频数fij落入第i行和第j列的概率,即22期望值的分布期望值分布表观点:不赞成观点:赞成合计男女58×33.3%=1965×33.3%=2258×66.7%=3965×66.7%=435865合计418212323对比分布表观察值与期望值频数对比分布表观点:不赞成观点:赞成男:观察值期望值女:观察

8、值期望值2319182235394743期望频数的分布(算例)由于观察频数的总数为n,所以f11的期望频数e11应为例如,第1行和第1列的实际频数为f11,它落在第1行的概率估计值为该行的频数之和r1除以总频数的个数n,即:r1/n;它落在第1列的概率的估计值

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。