优化特征选择的ctm模型在文本分类中的应用研究

优化特征选择的ctm模型在文本分类中的应用研究

ID:35043431

大小:5.60 MB

页数:53页

时间:2019-03-16

优化特征选择的ctm模型在文本分类中的应用研究_第1页
优化特征选择的ctm模型在文本分类中的应用研究_第2页
优化特征选择的ctm模型在文本分类中的应用研究_第3页
优化特征选择的ctm模型在文本分类中的应用研究_第4页
优化特征选择的ctm模型在文本分类中的应用研究_第5页
资源描述:

《优化特征选择的ctm模型在文本分类中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级U口C编号采中钟装欠考硕:t学位论文化化精化遠择的CTM摸型在文本分类中的应用研苑V学位申请人姓名:柄正良’申请学位学生类别:工程硕击申请学位学科专业:计算如i技米指导教师姓名:每长袜到教援巧去学位论文MA'STERSTHESSI硕d:学位论文优化特征选择的CTM模型在文本分类中的应用研究论文作者:杨正良指^师:马长林副教授戦专业:计IWI技术研究方向:机器学习华中师范大学计算执学院2016年5月硕去学位论文MASTERSTHESISAlica

2、tionofCTMmodelOtimizationpppFeatureSelectioninTextCateorizationgAThesisSubmitedinPartialFulfillmentoftheRequirementFortheM.S.DegreeinComputerTechnologyByYanZhenliangggPostradua化ProramggSchoolofComuterpCen化alChinaNormalUniversitySuervisor:MaChangli

3、npAcademicTitle:AssociateProfessorSinaturegArovedppMay,2016硕壬学位论文MA'STERSTHESIS华中师疮大学学侄冷文廣创牲京巧和使用狡枚说巧尿准1牲京巧本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研巧成果。除文中己经标明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研巧成果。对本文的研究做出贡献的个人和集体,均己在文中明确方式标明。本声明的法律结果由本人承担。《作者签《:曰期:年月曰/学化冷文狀权使用援权书本学

4、位论文作者完全了解学校有关保留、使用学位论文的规忠即:学較有权保留并向国家有关部口或机构送交论文的复印件和电子版允许论文被查阅和借阅。本人授权华中师范大学可W将本学位论文的全部或部分内龍入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同意华中师范大学可W用不同方式在不同媒体上发表、传播学位论文的全部或部分内备作者签名:导师签;日期:月日日期:年^月日^年<^/I""本人己经认真阅读CALIS高校学位论文全文数据库发布章程,同意将本人的""""学位论文提交CALIS高校学位论文全文数据库中全文发布,并可按章程中的同意论古播

5、々后滞后一年规定享受相关权益。:□半年:□:□二年发布。作者签名:导师签;曰期:7〇11年(月曰曰化日f护(月(>6硕壬学位论文MASTERSTHESIS摘要随着互联网的快速发展、海量信息的出现,人们己经从信息资源匯乏的年代过渡到信息资源丰富的大数据时代。如何快速、有效地从海量信息中提取所需的信息一大挑战一是当今信息科学和技术领域面临的,而文本分类就是解决这问题的途径一之。其中特征选择和文本表示是影响文本分类的重要因素,现阶段相关主题模型CTM(CorrelatedTopicModel)己作为有效的文本表示方应法用在文本分类中,

6、该模型能很好的表现出主题之间的相关性,同时在力求保证信息完整性的条件下有效地降低文本数据的维度,对分类精度和速度都得到了提髙。然而该模型输入特征的选择和最优主题数的确定仍然是一大难题。本文针对CTM模型在文本分类中的特征选择方法,W及模型的最优主题数确定一工作做了;定的研究,完成了W下(1)分析当前文本分类中文本表示遇到的困难化及CTM模型在文本表示中的优点;(2)采用基于复杂度和对数似然值的方法,确定CTM模型中的最佳主题数;3一M()采用种基于主成分分析与互信息相结合的CT模型特征选取方法,从而减少冗余特征;(4)基于上述理论方法,采用R

7、语言的相关函数包建立CTM模型,并构建文本分一类实验系统,,验证了所使用方法的有效性为进步开发文本分类应用系统提供了帮助。-,工作进行了总结。最后对所做的,并对W后将要研巧的内容进行了展望:文本表示关键字;相关主题模型;主题数目;特征选取;主成分分析;互信息I.一硕击学位论文MASTERSTHESISAbstractWiththerapiddevelopmentoftheI打tem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。