欢迎来到天天文库
浏览记录
ID:35173635
大小:2.93 MB
页数:42页
时间:2019-03-20
《logit模型参数估计方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、..■/V户f/’?已\苗’%;%、1033502027单位代码:.分类号:2143507巧学号:Q—密级:?如八、掌硕±学位论文%论文题目Logit模型参数估计方法的研究laeterestinLogitmodeThestudyofpramimation作者姓名孙海云指导教师张立新教授尝科(专化1统计学所在送院数学科学学院二零一六年五月提交日期__独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W称注和致谢
2、的地方外,论文中不包含其化人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教巧机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。,签字日期学位论文作者签名:或ife吝:节)年月Jr曰|占6学位论文版权使用授权书本学位论文作者完全了解浙江大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可W将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在
3、解密后适用本授权书)、5学位论文作者签名;或、备导师签名:^^签字円期:如年《月1:円签字曰期:年/月(曰浙江大学硕±论文摘要摘要近年来,统计学与机器学习得到了深入的发展,数据正W前所未有的速度产生着,越来越多的统计模型在计算机领域得到了广泛深入的应用,其中logit模.此外t、型发挥了重要的作用,logi模型在处理经济生物医药、金融、语音W一及图像识别上逐渐显示出良好的特性.t而对于logi模型的参数估计,人们般根据训练样本构造极大似然函数,结合拟牛顿法或者梯度下降法对目标函数进行逐步优化,来得到模型参数的估计值.这种参数求解方法有W下几
4、个局限性.首先是这种方法对于初值的选取有较大的依赖,而且并不能保证得到全局最优解;其次是进行求解的过程中,迭代的速度W及得到的结果的精度并没有成型的结论.此外,这种方法只考虑使用模型的离散的输出变量来进行参数估计,并没有考虑数据的内在结构,在实际运、、用中,受到了较大的限制.由于logit模型在经济金融生物等领域取得了不错的成果,所W研充这个模型参数求解的其他方法对于更好地发挥模型的效用有着较大的意义.Logit模型的基本假设是事件发生的对数机会比是各输入变量的线性函数.本文中对样本进行分组的思想正是基于此.在logit模型中,输入变量会对事一—一.个输出件
5、发生的概率产生影响对于给定的个输入,会W定的概率得到.一一由此,,得到这样个思想,给定组样本,这组样本的输入变量有的相同有的一不同,,我们根据样本数据的输入变量将输入变量相同的样本分为组,然后分别统计各姐的事件发生频率,这样可W得到多组不同输入条件下的事件发生的频率.这种通过对模型中的潜变量进行估计,继而进行模型的参数估计的方法,克服了极大似然估计参数估计方法忽视数据内在结构的弊端,提高了参数估计的精度I浙江大学硕±论文摘要本文在对模型中的潜变量进行估计后,提出了两种基于不同目标函数的参数估计方法.其中,,基于分组数据的最小二乘估计方法由于并非是迭代求
6、解所W对初值的依赖性在这里不存在,而且在样本量比较大时,算法所耗费的时间远远少于通过迭代进行参数估计的算法;此外基于分组数据的EM算法选定了基于核函数的目标函数,并且在目标函数中根据各分组样本量的不同,设置了不同的权重,克服了基于数据分姐的最小二乘估计方法对于各分组样本量分布的敏感性.在这两种基于数据分组的参数估计方法中,我们采用事件发生的频率来对事件发生的概率进行估计.其中基于分组数据最小二乘估计方法大大降低了估计的时间与空间的复杂度,基于分组数巧的EM估计方法,在迭代求解过程中,.对各个分组的样本量W及误差进行了考量.在实际应,在算法稳定性上表现良好
7、用中,我们可W结合H种方法对模型参数进行估计,能够更好地处理各类分类问题.关键词it:EM算法、log模型,最小二乘法II-c浙江大学硕±学位论文AbstiatAb巧ractInrecentearsiihinelihy,satsfesandmacearnngavebeendeveloedalot.Att;hepsametime,data
此文档下载收益归作者所有