欢迎来到天天文库
浏览记录
ID:43514051
大小:1.24 MB
页数:61页
时间:2019-10-09
《应用统计学-绪论》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、马昕经济学教研室电话:62783253(H)Email:maxin@ncepu.edu.cn应用统计学教材:何晓群《多元统计分析》,中国人民大学出版社,2004参考书何晓群《现代统计分析方法与应用》,中国人民大学出版社,1998王学民《应用多元分析》,上海财经大学出版社JamsMLattin等著,《多元数据分析》(英文版),机械工业出版社考核方法:读书报告:30分(考试前交)期末考试(开卷):70分第一章绪论多元数据分析的必要性多元数据分析方法概论多元数据的描述统计基本知识回顾一、多元数据分析的必要
2、性信息时代——数据时代,决策:经验→科学经济发展科学研究军事企业组织——信息组织市场分析投资决策设备管理你的直觉判断总是正确的吗?基于数据分析的决策对LaQuinta旅馆进行以回归分析为基础的选址数据分析从大量数据中发现尽可能多的有用信息,从而把握事物特征的过程每个数据:反映某个事物某一方面的特征统计学:单变量分析描述统计集中趋势离散趋势变量分布异常点推断统计:从样本统计量推断总体参数参数估计:样本均值估计总体均值,假设检验:总体均值或方差的检验,两总体均值/方差相等的检验相关分析:两个随机变量间的
3、(线性)相关程度回归分析:一个随机变量和一组随机变量间的依存/相关关系为什么需要多元数据?一般来说事物通常具有多面性,即每一事物有多方面特征例:学生的能力、物种、国家经济实力、企业竞争力必须全面考虑事物的各个方面,才能对其正确认识。两变量分析有时会得到虚假结果DistinguishingMidgesSupposeweareinterestedinmeasuringthewinglengthandtheantennalength.DistinguishingMidgesWhatcanyoudowith
4、bothvariablesthatyoucan’tdowithjustoneofthem?Simpson’sParadoxExample:44%ofmaleapplicantsareadmittedbyauniversity,butonly33%offemaleapplicantsDoesthismeanthereisunfairdiscrimination?UniversityinvestigatesandbreaksdownfiguresforEngineeringandEnglishprogr
5、ammesMaleFemaleAccept3520Refuseentry4540Total8060为什么需要多元数据-续Simpson’sParadoxNorelationshipbetweensexandacceptanceforeitherprogrammeSonoevidenceofdiscriminationWhy?MorefemalesapplyfortheEnglishprogramme,butitithardtogetintoMoremalesappliedtoEngineering,
6、whichhasahigheracceptanceratethanEnglishMustlookdeeperthansinglecross-tabtofindthisoutEngineeringMaleFemaleAccept3010Refuseentry3010Total6020EnglishMaleFemaleAccept510Refuseentry1530Total2040Simpson’sParadoxInthisexample,thebivariateanalysis(cross-tabu
7、lationorcorrelation)gavemisleadingresultsIntroducinganothervariablegaveabetterunderstandingofthedataItevenreversedtheinitialconclusions二、多元数据分析过程及方法反映对象行为的、可被观测的所有特征面精选特征面子集行为数据测量模型模式多元分析方法行为—数据—结构蠓:身体长度、翅膀长度、翅膀宽度、触角长度、…翅膀长度、触角长度定比数据SomeCommonPatternsi
8、nPointCloudsplanesfilamentsclustersoutliersDataAnalysis:FindingandInterpretingsuchPatterns多元数据分析方法概述多元分析的目的:探索数据的模式(结构)多元数据分析的难点:维度太多使我们难以发现规律、把握重点多元分析方法的核心:概要和简化工具:矩阵代数、统计软件具体方法聚类分析:按距离远近分类判别分析:给定样本定类——亲疏判别主成分分析、因子分析、对应分析:找出主要因素,化简数据方差
此文档下载收益归作者所有