欢迎来到天天文库
浏览记录
ID:49630047
大小:852.50 KB
页数:25页
时间:2020-02-26
《回归分析的基本思想及其初步应用(1).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.1回归分析的基本思想及初步应用(1)必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析统计的基本思想实际样本模拟抽样分析问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-------有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,得到如下所示的一
2、组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1):相关关系是一种不确定的关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):2、现实生活中存在着大量的相关关系。如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?1020304050500450400
3、350300·······发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455散点图1020304050500450400350300·······xy施化肥量水稻产量最小二乘法:称为样本点的中心。3、对两个变量进行的线性分析叫做线性回归分析。2、回归直线方程:2.相应的直线叫做回归直线。1、所求直线方程叫做回归直---线方程;其中相关
4、系数1.计算公式2.相关系数的性质(1)
5、r
6、≤1.(2)
7、r
8、越接近于1,相关程度越大;
9、r
10、越接近于0,相关程度越小.问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?负相关正相关相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;·······1020304050500450400350300xy施化肥
11、量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455解:1.画出散点图2.求出3.写出回归方程4.计算相关系数例题1从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.(1)由图形观察
12、可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数y=bx+a来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:y=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差。线性回归模型y=bx+a+ey=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差。自变量X称为解释变量,因变量Y称
13、为预报变量(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差来判断模型拟合的效果这种分析工作称为残差分析坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。错误数据模型问题身高与体重残差图异常点
此文档下载收益归作者所有