资源描述:
《法的软测量技术应用研究报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、.河北工业大学城市学院2013届本科毕业设计(论文)中期报告毕业设计(论文)题目:基于回归分析法的软测量技术应用研究专业(方向):自动化学生信息:学号:096227姓名:李潇婧班级:自动化C092班指导教师信息:教师号:98017姓名:梁秀霞职称:教授报告提交日期:2013年4月27日一、回归分析法的特点和原理1、回归分析法的特点人们经常会遇到一些处于同一个统一体中的变量,这些变量相互联系、相互制约,客观上存在一定的关系。但由于随机因素的影响,使变量之间的关系具有某种不确定性,无法得到精确的关系表达式。这时人们
2、往往用统计的方法,在大量反复的试验和观察中,寻找隐藏的统计规律性,即相关关系。这种研究变量间相关关系的统计分析方法称为回归分析法。回归分析是一种经典的建模方法,为我们寻找多个变量之间的函数关系或相关关系提供了有效的手段。回归分析法不需要建立复杂的数学模型,只要在收集到的大量易测变量数据的基础上,运用统计方法将这些数据中隐含的对象信息浓缩和提取,研究输出和输入之间的相互关系,从而建立主导变量和辅助变量之间的数学模型。它在参数预测、实时控制和工艺优化等方面均得到广泛应用。回归分析方法是数理统计诸方法中应用最广泛的一
3、个分支,它研究的主要问题是:(1)从一组数据出发,建立有相关关系的变量间的经验公式,也就是确定Y与X之间的定量关系表达式,这种表达式就是回归方程;(2)对求得的回归方程的可信程度进行统计检验;(3)从影响着某一个变量的众多变量中,判断哪些变量的影响是明显的,哪些变量的影响是不明显的,即判断哪个自变量X对因变量Y的影响最显著;(4)利用所求得的优化的关系式进行预测和控制。-..回归分析是研究1个变量Y与其它若干变量X之间相关关系的1种统计推断法。它是在一组试验或观测数据的基础上,利用数理统计方法建立因变量与自变量
4、之间的回归关系函数表达式,寻找被随机性掩盖了的变量之间的依存关系。粗略地讲,可以理解为用1种确定的函数关系去近似代替比较复杂的相关关系,这个函数在实际问题中称为经验公式。回归分析所研究的主要问题就是如何利用变量X,Y的观察值(样本),对回归函数进行统计推断,包括进行估计及检验与有关的假设等。1.1一元线性回归在一元线性回归中,有2个变量,其中x是可观测、可控制的普通变量,称为自变量或控制变量,y为随机变量,称为因变量或响应变量。通过散点图或计算相关系数判定y与x之间存在着显著的线性相关关系,即y与x之间存在如下
5、关系:其中未知参数a,b及都不依赖于x,称为一元线性回归模型。为随机误差或随机干扰,是1个分布与x无关的随机变量,常假定其为均值为0的正态变量。建立一元线性回归模型的过程,就是利用一组观测数据(i=1,2,,,n)确定参数a,b的最小二乘估计值和的过程,进而得到y关于x的经验回归方程。一元线性回归分析的任务就是要利用这组数据求出回归系数,,并对参数和方差进行估计,并对回归的效果进行显著性检验,从而接受回归模型,最后在把模型用于预测和控制。1.2多元线性回归多元线性回归是多元回归中最简单的一种,一些非线性回归和多
6、项式回归均可化为多元线性回归。多元回归分析法运用的是最小二乘法,为了避免矩阵求逆运算可以采用递推最小二乘法。在最小二乘法基础上又提出了许多改进的算法,如逐步回归法、主元分析、主元回归以及部分最小二乘法。在实际的问题中,影响变量y的因素往往不只1个,而包含多种影响的多个自变量x。通常要研究1个因变量y与多个自变量之间的相互关系称为多元回归分析,其回归模型为:其中都是与无关的未知参数,为互相独立的服从均值为0,方差为的正态随机变量。建立多元线性回归模型的过程,就是利用一组观测数据,(i=1,2,,,n),在最小二乘
7、法原则下确定m+1个回归参数的估值,,,-..的过程,即得到m元经验线性回归方程。多元线性回归分析的过程与一元线性回归分析类似,即把作为未知数,令X=[],i=1,2,,m作为已知系数,把多元回归模型表示成线性方程组的形式然后采用一元线性回归分析的方法进行参数的估计以及回归效果的假设检验。1.3非线性回归自变量与因变量之间的关系并非都是线性的,常常会出现非线性关系。解决这种非线性回归问题,一般都是通过变量的变换化为线性回归问题:即把曲线方程化为直线方程。当把非线性模型化为线性形式以后,就可以采用线性回归分析方法
8、。建立非线性回归模型的过程:通过适当的变量替换将非线性关系线性化;用线性回归分析方法分析新变量下的线性回归模型,求出未知参数的估计值,得到非线性回归方程,并对其做相应的显著性检验,从而验证模型的严密性;通过新变量之间的线性相关关系反映原来变量之间的非线性相关关系。2、回归分析法的原理在线性回归中,多元线性回归技术应用是最广泛的,以下是该方法的原理。设有p个因变量(输出主导变量)其中:(