欢迎来到天天文库
浏览记录
ID:38737232
大小:343.00 KB
页数:25页
时间:2019-06-18
《《回归分析_赵秀丽》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、线性回归分析报告人:赵秀丽指导教师:谢邦昌日期:2007年11月6日线性回归模型Regression节点生成线性回归模型。该模型是根据输入变量估计预测输出变量的最佳线性方程。回归方程代表一条直线或者平面,其预测值与真实输出值的离差最小,这是一种非常常用的用于概括数据并作出预测的统计方法。要求要求:只有数值型变量可用于回归模型。必须只有一个“OUT”变量和一个以上的“IN”变量。变量方向为“Both”或“None”的变量将被忽略;同样被忽略的有非数值型变量。线性回归模型的优点优点:回归模型相对简单,并为生成的预
2、测给出易于解释的数学方程。由于回归建模一个比较成熟的统计方法,回归模型的特性容易理解。而且回归模型训练起来也非常快。线性回归节点提供自动选择变量的方法以删除方程中的不显著的输入变量。线性回归节点模型选项线性回归节点模型选项(如图)modelname:指定要产生的模型名称;Method:指定建立回归模型的方法;Includeconstantinequation:方程中包括常数.建立回归模型的方法方法(1):进入法(Enter)这是预设的方法,将所有的变量直接选入方程,在建模中没有变量选择。建立回归模型的方法方法
3、(2):逐步节选法(Stepwise)即逐步回归变量选择方法一步一步建立方程。初始模型是最可能简单的模型,方程中没有一个输入变量。在每一步,对未进入方程的变量进行评估,如果这些变量中最好的变量能显著增强模型的预测效果,则添加该变量进入方程。此外,已经存在于防城中的变量将被重新评估,以决定其是否可被从方程中除去而不显著减损方程的效果,如果可以,则将被除去。随后,重新进行该步骤,添加或除去其他变量。在没有变量可添加到方程以改进方程,也没有变量可被除去而不显著减损方程时,生成最终模型。建立回归模型的方法方法(3):
4、后退法(Backwards)后退法变量选择与逐步回归变量选择的相似之处都是逐步建立模型。不同之处是后退法下最初的模型包括所有的输入变量作为预测变量,变量只能被剔出模型而不能被添加到模型。对模型几乎没有贡献的变量被一个一个的剔除出模型,知道剩下的每一个变量都显著影响模型预测效果,此时生成最终的模型。建立回归模型的方法方法(4):前进法(Forwards)前进法本质上与后退法相反。前进法下最初模型是没有任何输入变量的最简化模型,变量只能被添加到模型中而不能被剔除。在每一步,检验尚未进入模型的输入变量对模型的改进程
5、度,对模型改进程度最大的变量进入模型,在没有变量可添加到模型或者最后的备选变量对模型没有多大改进时,生成最终模型。方程中包含常数(Includeconstantinequation)该选项决定是否在最终方程中包含常数项。在大多数情况下,应选择该选项。如使用者有先验知识,只要预测变量为零时输出变量总是为零,则该选项很有用。线性回归节点高级选项高级选项可以使使用者调整建模进程;要使用高级选项,将Expert项目中的模式项(Mode)中设置为Expert。线性回归节点高级选项ModeMissingvaluesSin
6、gularitytoleranceSteppingOutput线性回归节点高级选项遗漏值(Missingvalues):在预设设置下,线性回归节点只使用模型中所有变量均有有效值的记录。如果有大量遗漏值,使用者可能会发现这种方法提出了太多的记录,使使用者没有足够的资料生成一个好的模型。在这种情况下可能取消选择Onlyusecompleterecords选项。Clementine会尝试用尽可能多的信息来估计回归模型,包括有些变量有遗漏值的记录。但是,在某些情况下,以这种方式使用不完整记录在估计回归方程时会引起计算
7、问题。线性回归节点高级选项奇异值容许度(Singularitytolerance):这一选项允许使用者指定某一变量独立于模型中其他变量的最小方差比率。线性回归节点高级选项逐步方式(Stepping):这些选项允许控制逐步筛选法、前进法、后退法中变量进入和剔除的准则。(如果选择了Enter法,则按钮不可用)。要了解更详细的情况,参见“线性回归节点逐步选项”。线性回归节点高级选项输出(Output):这些选项允许要求在该节点生成的模型的高级输出中所出现的附加统计量。要了解更详细的情况,参见“回归节点输出选项”。线
8、性回归节点逐步选项选择两个准则中的一个作为前进中的准则,然后确定使用者需要的临界值。注意:两个准则之间具有返乡关系。变量对模型越重要,P值越小,F值越大。线性回归节点逐步选项UseprobabilityofF(使用F的概率):该选项允许指定基于每个变量的关联统计概率(associatedpvalue)作为选择准则。只有当P值比Entry值小时变量才会添加到模型,也只有当P值比Removal值大时变量
此文档下载收益归作者所有