量表的制作-sites@duke

量表的制作-sites@duke

ID:21680838

大小:746.00 KB

页数:7页

时间:2018-10-23

量表的制作-sites@duke_第1页
量表的制作-sites@duke_第2页
量表的制作-sites@duke_第3页
量表的制作-sites@duke_第4页
量表的制作-sites@duke_第5页
资源描述:

《量表的制作-sites@duke》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、STATADemo讲授人:俞振华复回归分析一、复回归(multiplelinearregression)简单说,就是在线性回归分析中放入二个以上的自变量,以解释在控制其它相关变量下,某一个X对Y是否仍具有显著的影响?影响又有多大?在操作上如同简单回归,如果是「语法」,即在X1后面直接加入X2、X3……;如果是「窗口点选」,也直接在independents框框中加入X2、X3……即可。范例说明:我们假设台湾选民对于马英九的评价(q03a—mascore)受到对国民党评价(p02a—kmtscore)

2、及民进党评价(p02b—dppscore)的影响,故尝试以回归分析进行检证。.gendppscore=p02b.replacedppscore=.ifdppscore>10.labelvardppscore"0-10dpppreferredscore"程序语法:regYX1X2X3[iw=weightingvar.].regmascorekmtscoredppscore[iw=w]7STATADemo讲授人:俞振华二、虚拟变量(DummyVariable)的操作与解释在进行回归分析时,若有欲放入模

3、型之X为「类别变量」时,必须先转换成「虚拟变量」(dummyvariable),以0、1代表后,才能放入模型中,至于设定为0的类别,即是被比较的基准组。例如二分类的「性别」,可用1代表女性、0代表男性,若是三分类以上的(如年龄层、教育程度),亦设定一类为0,另两类为1。至于类别变量在经虚拟转换后,将变成原来类别变量的类别数减1,也就是原来变量的value有两类,虚拟变量即为一个;原来变量的value有三类,虚拟变数即为两个,依此类推,而未被转换的那一个value即当作比较的基础(base)。兹以下

4、表来说明:虚拟变项高  中原变项高:1中:2低:31  00  10  0范例说明:我们假设台湾选民对于马英九的评价(mascore),除了受到对国民党评价(kmtscore)及民进党评价(dppscore)的影响外,也会受到选民的「性别」(gender转成female)与「省籍背景」(sengi4)的影响,故尝试以回归分析进行检证,除了原来的连续变量的X外,再将新创立的虚拟变量投入模型中。.recodegender(1=0)(2=1),gen(female).labeldefinefemale0

5、“male”1“female”.labelvaluesfemalefemale程序语法:regYX1X2X3[iw=weightingvar.].regmascorekmtscoredppscorefemalei.sengi4[iw=w].fvsetbase4sengi4.regmascorekmtscoredppscorefemalei.sengi4[iw=w]7STATADemo讲授人:俞振华三、共线性(multi-collinearity)检测由于复回归分析中,自变量彼此间多少会有一定程度的

6、相关性,但彼此的相关性若太高,将会致使S.E.受到高估,导致β值不显著。征兆:当回归模型的R2很高,但理论上的自变量却不显著时,即有可能发生multi-collinearity。检测方式:直接看统计报表中的VIF值(varianceinflationfactor)。它的原理是将自变量间彼此透过回归分析的方式(轮流当Y),来检测自变量间的R2大小,当然,自变量之间的R2愈小愈好,表示彼此之间不存在高度的解释力。其中,(1/VIF)即是自变量彼此之间无法解释的部分(1-R2),又被称之为「tolera

7、nce」,当然愈大愈好,反之VIF的值愈小愈好。至于VIF的值要多大才算有multi-collinearity?一般而言,通常如果其中一个变量的VIF值大于10(也就是自变量彼此间的R2,达0.9以上),即表示自变量间存在multi-collinearity。软件操作:在完成回归分析的语法后,再输入vif即可呈现。7STATADemo讲授人:俞振华窗口操作:(Stata)「Statistics」→「Linearmodelandrelated」→「regressiondiagnostics」→「Sp

8、ecificationtests,etc」,即会出现检测的对话框。进一步在对话框中选择VIF。7STATADemo讲授人:俞振华解决方式:(1)针对高度相关的自变数进行删减,或思考将这些高度相关的自变量建立成为一个量表后,再放入回归模型中。(2)centering,就是将高度相关的自变量减去该变量的平均数,让变量的分布向0靠拢,这通常会用在探讨「U型」或「倒U型」曲线关系的自变项上,例如:年龄与投票参与的关系,年轻时向上升、中年时到达高峰、老年时下滑。7STATADemo讲授人:俞

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。