欢迎来到天天文库
浏览记录
ID:40105973
大小:215.50 KB
页数:17页
时间:2019-07-21
《《西格玛培训》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第8部分:回归分析方法复习目的:将回归分析方法作为一种经验式的过程建模技术来进行评论,回归分析方法主要应用于具有连续的Y响应和连续的X变量的过程。目标:复习回归分析方法使用的时机和原因。复习如何使用多重回归分析法将多个数据点拟合成一条线,从而构造该直线的相应等式,以在给定多个X的情况下预测Y。复习回归分析方法中的误区。第8部分-回归分析方法复习回归分析方法…寻找X和Y对应关系的有效方法什么是回归分析方法?回归分析方法是一种描述变量X和Y之间对应关系的数学方法-为过程建模。Y=b0+b1x+e其中:b0是Y的截距
2、b1是直线的斜率e是模型的误差项为什么使用回归分析方法?找到潜在的关键少数X变量预测/预报Y变量优化Y变量确定在何处设置X变量以优化Y变量何时使用回归分析方法?筛选被动数据(历史数据或基线数据)以确定潜在关键X变量。对DOE(实验设计)结果进行分析。回归分析方法是一个需细心使用的功能强大的工具单变量回归分析方法我们可能对独立变量X和响应变量Y的相互关系很感兴趣,以下列举了一个表明其相互关系的散点图:1.51.00.50.00100200300400假定两变量间真正的关系式为:Yi=b0+b1*Xi+ei两者间存
3、在线性关系“b0”(常数)和“b1”(系数)是固定但未知参数“X”是独立变量。“Y”是被观察的响应值。“e”是误差项。通常对误差的假设为:-平均值为0.0-不相关-正态分布-误差的分布不存在任何型态使用回归分析方法时应切记以下事项:首先将数据绘图!1.51.00.50.00100200300400看似线性关系使用Minitab进行分析工作。分析残差的型态、正态性、变差以及模型的拟合性。使用R-sg(调整)确定模型所解释的变差量。会话窗口包括了分析结果…回归分析回归表达式为:Evap=0.069+0.00383v
4、elocity(即:蒸发量=0.069+0.00383周转率)预报器系数StDevTP常数0.06920.10100.690.512速度0.00382880.00043788.750.000S=0.1591R-Sq=90.5%R-Sq(adj)=89.3%分析变化:源数据DFSSMSFP回归11.93511.935176.490.000误差80.2.240.0253合计92.1375X变量-速度的p值H0:斜率=0Ha:斜率=0或换一种方式来讲:H0:该X为非显著Ha:该X为显著:速度影响蒸发作用参见附录部分对
5、对话窗口输出的更为详细的讲述。接受Ha回归分析回归表达式为:Evap=0.069+0.00383velocity(即:蒸发量=0.069+0.00383周转率)预报器系数StDevTP常数0.06920.10100.690.512速度0.00382880.00043788.750.000S=0.1591R-Sq=90.5%R-Sq(adj)=89.3%变差分析:源数据DFSSMSFP回归11.93511.935176.490.000误差80.2.240.0253合计92.1375此值(误差的标准差)越小,模型越
6、好。S:残差的标准偏差(误差)。误差是观测值减去预测值。换句话讲,是由观测值点到由回归等式所确定的拟和直线的距离。(对于一个优良的模型来讲,该值应当很小。)S=MS(error)1/2R-Sq:拟和直线所解释的变差百分比,由X解释的变差(对于一个优良模型来讲,该值应很大)。R2=SSregressionSStotalR-Sq(adj):对于过度拟合情况的进行调整(在回归表达式中设置过多变量),因而综合考虑模型中合并的项数与观测值数目:R2(adj)=1-n-1(1-R2)n-p其中:n=观测值的数量p=包括常数
7、在内的模型所包含的总项数什么是多重回归?定义连续变量Y和多个连续变量X之间关系的一种方法。在所提供的数据的基础上构建的工序数学模型。为什么使用多重回归?它不仅能够以线性方程,还能够使用二次方程式建立工序的数学模型(二次方程中含有平方项)。表达式的一般格式?Yi=b0+b1*X1i+…+bk*Xki+error如果在回归中采用了基线数据,你必须运行DOE来确认该模型(证实这些X变量确实对Y变量有控制作用)通过对中X提供正交性多重回归表达式中的X变量可以是独立的不同的变量,也可能是相互关联的,如:X12或X1*X2
8、当两个变量相关时,如何分离其各自产生的影响?(X1确实与X12相关)对X变量进行变换,以分离它们各自对Y所产生的作用。这种分离可以通过将数据集中在其平均值上而实现,即用单个的数据点减去其平均值(Xj-X)。Mintab中称此类变换为“编码数据”。原始数据与编码数据几乎是正交的,这样便可以实现作用分离。数据必须编码,以使p值有意义。让我们来看一个实例…多重回归-扭转次数定义设计方案插图为
此文档下载收益归作者所有