从数据到结论人民大学吴喜之教授变

从数据到结论人民大学吴喜之教授变

ID:40059925

大小:1.71 MB

页数:38页

时间:2019-07-18

从数据到结论人民大学吴喜之教授变_第1页
从数据到结论人民大学吴喜之教授变_第2页
从数据到结论人民大学吴喜之教授变_第3页
从数据到结论人民大学吴喜之教授变_第4页
从数据到结论人民大学吴喜之教授变_第5页
资源描述:

《从数据到结论人民大学吴喜之教授变》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、变量间的关系直到现在我们所涉及的仅仅是对一些互相没有关系的变量的描述。但是现实世界的问题都是相互联系的。不讨论变量之间的关系,就无从谈起任何有深度的应用;而没有应用,前面讲过的那些基本概念就仅仅是摆设而已。变量间的关系人们每时每刻都在关心事物之间的关系。比如,职业种类和收入之间的关系、政府投入和经济增长之间的关系、广告投入和经济效益之间的关系、治疗手段和治愈率之间的关系等等。这些都是二元的关系。还有更加复杂的诸多变量之间的相互关系,比如企业的固定资产、流动资产、预算分配、管理模式、生产率、债务和利润等诸因素的关系是不能

2、用简单的一些二元关系所描述的。例1广告投入和销售之间的关系(数据ads.sav)这是什么关系?这两个变量是否有关系?显然,它们有关系;这从散点图就很容易看出。基本上销售额是随着广告投入的递增而递增。如果有关系,它们的关系是否显著?这也可以从散点图得到。当广告投入在6万元以下,销售额增长很快;但大于这个投入时,销售额增长就不明显了。因此,这两个变量的关系是由强变弱。这些关系是什么关系,是否可以用数学模型来描述?本例看上去是可以拟合一个回归模型(后面会介绍),但绝不是线性的(用一条直线可以描述的)。具体细节需要进一步的分析

3、这是什么关系?这个关系是否带有普遍性?也就是说,仅仅这一个样本有这样的关系,还是对于其他企业也有类似的规律。这里的数据还不足以回答这个问题。可能需要考虑更多的变量和收集更多的数据。一般来说,人们希望能够从一些特殊的样本,得到普遍的结论,以利于预测。这个关系是不是因果关系?在本问题中,看来有因果关系。这类似于一种试验;而试验时是容易找到因果关系的。但是,一般来说,变量之间有关系但绝不意味着存在因果关系。定性变量间的关系(关于某项政策调查所得结果:table7.sav)观点:赞成观点:不赞成低收入中等收入高收入低收入中等收

4、入高收入男201055810女25157279大致可以看出女性赞成的多,低收入赞成的多定性和定量变量间的混和关系假想关于高等学校的数据的一些指标包括:在校生人数(S),研究生比例(G),教师人数(F),职工人数(ST),SCI和SSCI文章数目(P),SCI和SSCI文章引用数目(Q),科研项目数(PR),科研经费(B),总经费及招生范围(N)等从这个数据很难马上看到任何关系。但是从这个数据可以得到许多有用的关系和结论。比如,可以得到任何一个变量和其余变量之间的定量关系或者多个变量之间的定量关系(因而可以建立模型,进行

5、预测和各种推断);也可以利用其中一些变量把各个高等学校分类;还可以把众多的变量用少数几个变量代替以利于分析和理解;此外这个数据可以作为高校排名的根据之一。所有这些都是未来章节的内容。相关和回归分析相关和回归分析顾客对商品和服务的反映对于商家是至关重要的,但是仅仅有满意顾客的比例是不够的,商家希望了解什么是影响顾客观点的因素以及这些因素是如何起作用的。一般来说,统计可以根据目前所拥有的信息(数据)建立人们所关心的变量和其他有关变量的关系(称为模型)。假如用Y表示感兴趣的变量,用X表示其他可能有关的变量(可能是若干变量组成

6、的向量)。则所需要的是建立一个函数关系Y=f(X)。这里Y称为因变量或响应变量,而X称为自变量或解释变量或协变量。建立这种关系的过程就叫做回归。相关和回归分析一旦建立了回归模型可以对各种变量的关系有了进一步的定量理解还可以利用该模型(函数)通过自变量对因变量做预测。这里所说的预测,是用已知的自变量的值通过模型对未知的因变量值进行估计;它并不一定涉及时间先后的概念。例1有50个从初中升到高中的学生.为了比较初三的成绩是否和高中的成绩相关,得到了他们在初三和高一的各科平均成绩(数据:highschool.sav)从这张图可

7、以看出什么呢?问题是怎么判断这两个变量是否相关?如何相关?相关的度量是什么?进一步的问题是能否以初三成绩为自变量,高一成绩为因变量来建立一个回归模型以描述这样的关系,或用于预测。还有定性变量该数据中,除了初三和高一的成绩之外,还有一个定性变量它是学生在高一时的家庭收入状况;它有三个水平:低、中、高,分别在数据中用1、2、3表示。还有定性变量下面是对三种收入对高一成绩和高一与初三成绩差的盒形图例2这是200个不同年龄和性别的人对某项服务产品的认可的数据(logi.sav).年龄是连续变量,性别是有男和女(分别用1和0表示

8、)两个水平的定性变量,而(定性)变量“观点”则为包含认可(用1表示)和不认可(用0表示)两个水平的定性变量。从这两张图又可以看出什么呢?两个定量变量的相关如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能确定两个变量有没有关系呢?最简单的办法就是画出它们的散点图。四组数据(每个有两个变量的样本)的散点图几种相关的度量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。