数理统计基本概念_1ppt培训课件

数理统计基本概念_1ppt培训课件

ID:34237190

大小:336.50 KB

页数:42页

时间:2019-03-04

数理统计基本概念_1ppt培训课件_第1页
数理统计基本概念_1ppt培训课件_第2页
数理统计基本概念_1ppt培训课件_第3页
数理统计基本概念_1ppt培训课件_第4页
数理统计基本概念_1ppt培训课件_第5页
资源描述:

《数理统计基本概念_1ppt培训课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第Ⅱ部分:数理统计(Statistics)数理统计基本概念、数据的整理和描述统计量及其分布估计理论假设检验回归分析方差分析1为什么要学习统计?在当今这个信息时代,我们将随时随地成为信息的接收者,我们也随时需要处理身边和工作中的信息和数据.如此众多繁乱的信息,我们该如何”借来一双慧眼”,看个清楚明白呢?桑普拉斯说:统计分析让一切假象原形毕露。但是,统计中也有不少陷阱,蹩脚的数据分析师总是披着统计的外衣有意或无意地制造假象,许多年前的一本著作《Howtoliewithstatistics》就对此有过幽默而深刻的描述,最近出版了中译本名为《统计

2、陷阱》,达莱尔.哈夫著,廖颖林译,有兴趣的朋友不妨一睹为快。对于任何一个成功的应用项目来说,一个真正的统计学家和数据分析专家是必不可少的,他会指引你绕过礁石和旋涡,到达成功的彼岸。2几个统计故事1.1936年美国杂志<文学文摘>预测在总统大选中哪位候选人会胜出?2.中国知识分子的寿命比正常人寿命少10年?3.学历越高,收入越多,上网时间越长?31936年美国正从经济大恐慌中复苏,全国仍有9百万人失业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐.《文学文摘》(LiteraryDigest)杂志对结果进行了调查预测.他们根据当

3、时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370∶161的优势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,一个名叫乔治·盖洛普的人,对《文学文摘》调查结果的可信度提出质疑.他也组织了抽样调查,进行民意测验.他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福赢得了2770万张民众选票,兰登得到1600万张选票;罗斯福赢得了除缅因州、佛蒙特州以外48个州的民众选票,获得

4、选举团523张选票的98%强,而兰登的选票低于2%(8张).最终,罗斯福以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销声匿迹,而盖洛普则名声大噪.41.数理统计基本概念总体(population):具有相同性质的个体组成的集合。无限总体(infinitepopulation):总体中包含的个体数目有无穷多个,这种总体称为无限总体。5有限总体(finitepopulation):总体中包含的个体数目有限,这种总体称为有限总体。观察值(observation):每一个体的某一个性状、特性的测定数值叫做观察值。参数(paramete

5、r):由总体的全部观察值而算得的总体特征数,如总体平均数,称为参数。6样本(sample):从总体中抽出的一部分个体的集合。估计值(estimate):由样本函数确定的总体相应参数的函数值。随机样本(randomsample):从总体中随机抽取的样本,满足随机性和等可能性。样本容量(samplesize):样本中包含的个体数,用n表示。72.数据整理与描述2.1数据资料的性质与分类2.2数据频数或频率分布表2.3数据频数或频率分布图82.1数据资料的性质与分类一、数量性状资料数量性状(quantitativetrait)的度量有计数与量测

6、两种方式。1、不连续或间断性变量(discontinuousordiscretevariable):指用计数方法获得的数据。2、连续性变量(continuousvariable):指称量、度量或测量方法得到的数据。9二、质量性状资料质量性状(qualitativetrait):指能观察而不能量测的性状。1、统计次数法2、给予每类性状以相对数量的方法。102.2数据频数或频率分布表一、间断性变量资料的整理1、100个麦穗每穗小穗数的次数(频数)分布表每穗小穗数(y)次数(f)总次数(n)100151617181920615322517511

7、2、200个稻穗每穗粒数的次数(频数)分布表次数(f)每穗粒数(y)合计31-3526-3036-4041-4546-5051-5556-6061-6566-7071-7576-8081-85311021324138251683220012二、连续性变量资料的整理对于此类情况,一般的处理步骤是:1、数据排序(sort)2、求极差(range)R=Max(1…n)-Min(1…n)3、确定组数和组距(classinterval)组距=R/组数因而必须先确定组数。组数的确定,可参照以下的因素:(1)观察值个数的多少;(2)极差的大小;(3)便

8、于计算;(4)能反应出资料的真实面貌。134、选定组限(classlimit)和组中点值(组值,classvalue)首先选定第一组的中点值,这一点选定后,则该组组限确定,其余各组的中点值和组

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。