《数据的收集》PPT课件

《数据的收集》PPT课件

ID:41223123

大小:1.91 MB

页数:107页

时间:2019-08-19

《数据的收集》PPT课件_第1页
《数据的收集》PPT课件_第2页
《数据的收集》PPT课件_第3页
《数据的收集》PPT课件_第4页
《数据的收集》PPT课件_第5页
资源描述:

《《数据的收集》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《文学文摘》预测罗斯福竞选落败在美国1936年的总统选举中,两位竞争者分别是民主党的罗斯福和共和党的兰登。竞选前美国著名杂志《文学文摘》发放了1000万份的调查问卷,通过对收回的240万张问卷及电话调查的结果进行分析,预测兰登将获得57%的选票而最后的投票结果是:罗斯福以62%对38%一边倒优势胜出。《文学文摘》也最终因此而破产倒闭。问题:为什么《文学文摘》调查的样本量如此之大,结果却那样离谱?1、样本抽选有偏差兰登的支持者主要是富裕阶层,大资产阶级,而罗斯福的支持者主要是一般工薪阶层、中下层平民。在1

2、936年,美国约有1100万户家庭拥有电话,有900多万失业人口。2、没有考虑缺失数据的影响在芝加哥对三分之一的选民进行调查,只有20%的比较富裕的阶层给予回答。罗斯福的百分数盖洛普预言《文摘》的预测结果44《文摘》预测的选举结果43盖洛普预测的选举结果56选举结果62盖洛普预测民意调查(二)1948年的美国总统选举中,两位竞争者分别是共和党的杜威和民主党杜鲁门。Thebuckstopshere———杜鲁门候选人克劳斯莱盖洛普罗伯尔结果杜鲁门45443850杜威505053451、配额抽样例如,盖洛普的

3、民意测验在圣.路易斯访问13对象,要求(1)6人住近郊,7人住在市中心(2)男的7人,女的6人(3)7个男的中3个40以下,4人40岁以上2、访问人员自由选择配与定额的方法调查偏差的原因年份盖洛普预测共和党得票百分数共和党实际得票百分数有利于共和党的误差193644386194048453194448462杜威50455共和党偏性盖洛普民意测验记录年份样本容量获胜候选人盖洛普民意预测选举结果误差19525385艾森豪威尔51%55.4%+4.4%19568144艾森豪威尔59.5%57.8%-1.7%1

4、9608015肯尼迪51%50.1%+0.9%19646625约翰逊64%61.3%-2.7%19684414尼克松43%43.5%+0.5%19723689尼克松62%61.8%-0.2%19763439卡特49.5%51.1%+1.6%19803500里根55.3%51.6%-3.7%19843456里根59.0%59.2%0.2%19884089布什56.0%53.9%-2.1%2010年9月第2章数据的搜集§2.1数据的来源§2.2调查数据§2.3实验数据§2.4数据的误差2010年9月§2.1

5、数据的来源原始数据和二手数据的比较比较项目原始数据二手数据收集目的为了手中的问题为了其他问题收集程序非常费劲快且容易收集成本高相对较低收集时间长短2010年9月系统外部的数据统计部门和政府部门公布的有关资料专业调查机构提供的数据各种会议,学术性研讨会上交流的资料从互联网或图书馆查阅到的相关资料2010年9月系统内部的数据业务资料:发票统计资料:统计报表财务资料:成本其他资料:顾客建议2010年9月二手数据的评估数据的可靠性数据收集的目的性数据收集的方法数据的及时性《金钱》杂志公布了一项研究,揭示了消费者

6、认为的航空公司最重要的特点。按照重要性顺序,依次是安全、价格、行李处理、按时起飞、乘客服务、以及食品。《金钱》根据这些特点评出了美国10家最大的航空公司。二手数据评估数据的直接来源实验数据通过实验方法得到的数据通常是对自然现象而言也被广泛运用到社会科学中如心理学、教育学、社会学等2010年9月数据的直接来源1.调查数据通过调查方法获得的数据通常取自有限总体2.按调查包括的范围:(1)全面调查:普查(2)非全面调查:重点调查、典型调查、抽样调查普查:对总体中的所有个体进行调查如:人口普查、工业普查等特点:

7、(1)通常是周期性的,一般需间隔较长时间;逢“0”年份:人口普查逢“3”年份:第三产业普查逢“5”年份:工业普查逢“7”年份:农业普查普查(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏;(3)准确性一般较高,较规范;(4)只能调查一些最基本、最一般的现象。如:第五次人口普查登记的标准时间是2000年11月1日凌晨零时2010年9月§2.2调查数据概率抽样与非概率抽样搜集数据的基本方法2010年9月概率抽样和非概率抽样2010年9月概率抽样也称随机抽样2.特点:按随机原则抽取样本个体都有

8、一定的机会被抽中个体被抽中的概率是已知的样本可以对总体目标量进行估计3.抽样框:所有总体单位信息2010年9月简单随机抽样定义:从总体中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础在某城市某街道所管辖的10000户居民中,抽取200户居民,就居民对某种商品的需求量进行调查,就可以做10000张纸片,写上1-10000号,从中随机(或按随机数)抽取200张,被抽中的居民即为样本。简单随机抽样

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。