基于潜变量的PCA降维方法在文本分类问题中的应用

基于潜变量的PCA降维方法在文本分类问题中的应用

ID:37027858

大小:3.07 MB

页数:54页

时间:2019-05-15

基于潜变量的PCA降维方法在文本分类问题中的应用_第1页
基于潜变量的PCA降维方法在文本分类问题中的应用_第2页
基于潜变量的PCA降维方法在文本分类问题中的应用_第3页
基于潜变量的PCA降维方法在文本分类问题中的应用_第4页
基于潜变量的PCA降维方法在文本分类问题中的应用_第5页
资源描述:

《基于潜变量的PCA降维方法在文本分类问题中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文⑩基于潜变量的PCA降维方法在文本分类问题中的应用作者姓名吕建科指导教师张朋教授学科(专业)统计学所在学院数学科学学院提交日期2018年1月独创性声明本人声+明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,论,除了文中特别加以标注和致谢的地方外文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机一构的学位或证书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:如J年名月2日

2、学位论文版权使用授权书本学位论文作者完全了解浙江大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:导师签名:签字曰期:年月曰签字曰期:年月曰>丨&4¥57学位论文作者毕业后去向:H>工作单位::电话通讯地址:邮编摘要文本分类是实现处理和利用海量文本信息的有效方式,尽管在过去几十年文本

3、分类领域关键技术已经取得了重大发展、高稀疏,但是随着大数据时代的到来,具有高维程度特点的文本分类性能上还有很大改进空间.本文针对文本分类问题高维、稀疏的特点,对基于主成分分析的特征选择方法进一PCA行改进.基于,提出了种对于基于潜变量的主成分降维方法潜变量的降维方法假设生成文本的过程中特征词的选择由服从正态分布的潜变量所决定,用数学期望估计特征取值的真实值,增加特征词出现时的权重,实验表明该方法能够有效减少特征维度并实现更好的分类效果,分类准确率提升5%左右.关键词:文本分类;特征降维;主成分分析;潜变量表示IAbstractText

4、ve-categorizationisaneffectimethodtodealwithlareamountoftextingformationtttitttti.Inheasfewdecades,keechnoloiesnhefieldofexcateorizaonpygghavedeveloedsinificantlhoweversincethetraditionaltextreresentationisofpgy,,p'hihdimensionalityandWhsarsittheress

5、tilllentofroomtoimroveintextggpy,pypcateorizationwiththearrivaloftheeraofbidata.ggThisah--eraimsatthehidimensionalandsarsefeaturesoftextclassificappgpnndr-thfltalblattreretioaoosesameodorinciacomonennasisasedonenpppppypsentationwhichhasimrov

6、edtheerformanceofrincialcomonentanalysis.weppppptt?suosethathechoiceoffeaurewordsineneratintextsisdeterminedbthelappggytentvariablessubecttonormaldistributioninthemethodofrincialcomonentjpppanalsisbasedonlatentreresentationandestimatethetruevalue

7、ofthefeatureypme?valuewithmathematicalexectation.Exerimentsshowthatthisthodcanefppfectivelyreducethefeaturedimensionandachievebetterclassificationrestiltsbyincreasedtheweihtofthefeaturewordwhenitaearsinthetex

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。