欢迎来到天天文库
浏览记录
ID:37509316
大小:968.60 KB
页数:39页
时间:2019-05-11
《分析数据间的相关性》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Excel数据统计与分析主讲:张小兰电话:13560022398Email:zhangxl5659@163.com第四章分析数据间的相关性世间万物总是存在不同程度的联系函数关系统计关系线性相关XY正线性相关负线性相关XY非线性相关4.2两数值型数据间的相关性(1)图形分析法散点图是统计关系分析中最常用的图形工具,它将数据以点的形式画在直角平面上,它将一组数据作为纵轴,将另一组数据作为纵轴,事物对象的每个个体以点的形式出现。(1)若所有点落在一条直线上,说明数据间是线性相关,是函数关系,不是统计关系。(2)所有点杂乱无章,从形态
2、上看不出任何特征和规律,表明数据间不相关(3)图形点大致呈某种曲线形态,表明数据间存在非线性相关(4)所有点大致落在一条直线周围,表明数据间有线性相关性。实践1999年31个省市自治区个人购买商品住房住宅面积与商品住宅销售额的数据,现要求利用散点图法分析个人购买商品住房住宅面积与商品住宅销售额之间的相关性。(2)数值分析法图形能够直观展现数据间的相关关系,但并不精确。简单相关系数通过数字准确描述数据间线性相关的方向和强弱程度。简单相关系数简单相关系数取值范围[-1,1]简单相关系数>0,表示两个数据正线性相关简单相关系数<0,
3、表示两个数据负线性相关简单相关系数=0,表示两个数据不存在线性相关简单相关系数>0.8,表示两个数据相关性很强简单相关系数<0.3,表示两个数据相关性较弱求简单相关系数的方法:(1)简单相关系数可通过函数Correl或Pearson实现(2)“数据分析”中相关系数命令实践1999年31个省市自治区个人购买商品住房住宅面积与商品住宅销售额的数据,现要求函数和“数据分析”命令分析个人购买商品住房住宅面积与商品住宅销售额之间的相关性。4.3两品质数据间的相关性从人事数据中分析性别跟职称是否相关?(1)图形分析法复式柱形图是柱形图的扩
4、展,主要用于对事物两个或多个特征的分类对比。(2)数值分析法---列联表在该图基础上进一步计算一些简单的百分比。列联表示例获不获得学分与性别是有关系的,男生获得学分的可能更大一些列联表示例获不获得公选课学分与性别是不相关的实践给定的性别与受教育程度数据进行相关性分析,做出他们的三维簇状柱形图及列联表。对人事数据中性别与职称进行相关性分析,做出三维簇状柱形图及列联表。4.4相关的可靠性检验总体与样本常常存在这样的情况,我们所观察的只是部分或有限的个体,而需要判断的总体对象范围却是大量的,甚至是无限的。比如说为了考察某公司生产的一
5、批电脑芯片的质量,需要了解芯片使用寿命这一指标。我们关心的是这一整批芯片的质量,但由于各种原因,只能抽取其中的一小部分进行测试。这时,这一整批芯片的质量和被抽取出来的那一部分的质量就构成了“整体”和“部分”的关系了。可靠性研究的就是分析样本数据所体现的相关或不相关在总体数据间是否依然存在假设检验的基础假定数据符合正态分布假设收集到无限多的数据,这些数据可能看起来像下图我们可将这些数据看成平滑的分布红线758060657055Inchesxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
6、xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx正态曲线和概率了解了正态曲线的平均值和标准偏差有助于估计风险Probabilityofsamplevalue43210-1-2-3-440%30%20%10%0%Z-axis(scalein
7、unitsof‘s’)Numberofstandarddeviationsfromthemean95.45%68.27%99.73%在两个值之间可以得到一個累積的概率值正态分布的应用43210-1-2-3-440%30%20%10%0%Probabilityofsamplevalue95.45%68.27%99.73%240255270285225210195Time(minutes)Z-axisX-axis如果我们货物交付给顾客的平均时间是240分钟,这一过程的标准偏差是15分钟,那么在270分钟后到货的概率为多少?正态分布
8、的应用2中国成年男子身高均为168cm,标准差为5.5cm.试计算:1、身高小于160cm的概率。2、身高高于180cm的概率。3、身高介于160-180cm的概率。假设检验的基本原理显著性水平显著性水平α是当原假设正确却被拒绝的概率通常人们取0.05或0.01这表明,当做出
此文档下载收益归作者所有