内容文本分类中的语义特征提取算法研究

内容文本分类中的语义特征提取算法研究

ID:33218838

大小:2.32 MB

页数:60页

时间:2019-02-22

内容文本分类中的语义特征提取算法研究_第1页
内容文本分类中的语义特征提取算法研究_第2页
内容文本分类中的语义特征提取算法研究_第3页
内容文本分类中的语义特征提取算法研究_第4页
内容文本分类中的语义特征提取算法研究_第5页
资源描述:

《内容文本分类中的语义特征提取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号⋯⋯⋯⋯⋯UDC173,5568密级编号⋯⋯⋯⋯⋯⋯十I初.大学CENTRALSOUTHUNIVERSITY82‘0-::。¨.-、原创性声明I舢llllllllllillllY1719195本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:耋娅日期:盟年上月j业日学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学

2、校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。作者签名:翮签名鲍期锄,Q年』月坦日摘要内容文本分类是根据给定文本的特征进行匹配,将其判别为事先确定的若干个文本类别中的某一类或某几类的过程。如何提取待分类数据中的语义特征是实现文本分类的关键技术。特征提取对于降低文本数据的处理维度,滤除数据噪声,提高分类准确率有着重要的意义。论文研究在不牺牲算法效率和精确度的前提下,如

3、何对传统特征提取算法进行改进。在深入分析无监督特征提取主成分分析算法和监督的Fisher判别分析算法的特点的基础上,提出了从数据重构和数据识别的角度建立了特征提取中描述特征和判别特征两个优化思想;结合谱图理论,研究了黎曼流形上的拉普拉斯.贝尔特拉米算子的线性近似,构造了一个类似Fisher判别函数的非监督判别准则;在深入分析非监督判别判别准则的基础上,提出了在特征提取时着重考虑文本类别特征的稀疏性和文本数据特征间具有的相关性、同义性以及多义性的特点对分类语义信息的影响,采用数据降维后保留类别语义信息的原则,避免仅考虑文本语义信息重构造成的分类准确度降低的缺点;通过分析潜在语义索引特征提取算法的

4、优点和不足,确定了从代数角度通过矩阵奇异值分解和广义特征值分解获取特征变换矩阵的方法,达到在不影响精准度的基础上减少特征提取的时间;通过深入研究经典线性-N另,J算法在语义特征提取运用,结合文本分类自身的特点,明确了文本分类不同于线性判别算法的监督聚类,从而构造基于文本向量间的相似矩阵和密度矩阵以提供类别语义信息。基于以上工作原理和关键技术,本文设计了一种判别语义特征提取算法DSFE。采用国际通用语料数据集和web网页数据作为实验语料,对于所设计的算法进行了实验并对实验结果比较,使用准确率和归一化互信息评价算法,验证了DSFE算法在时间复杂度、分类准确性、抗噪声能力等方面都有较好的性能。关键词

5、Fisher判别分析,潜在语义索引,特征变换,判别语义特征提取ABSTRACTContenttextclassificationisgivenaccordingtothecharacteristicsoftext,thediscriminationforseveralmonthspriortothedeterminationofthetexttypeofcertainorprocess.HowtoextractthesemanticfeaturesforclassificationofdataiSthekeytechnologyoftextclassification.Thesemanticf

6、eatureextractionforreducingthetextdataprocessingdimension,filteringnoiseandimprovedataclassificationaccuracyhasimportantsignificance.Researchonprecisionandefficiencyofthealgorithmwithoutsacrificingthepremise,howtotraditionalsemanticsfeatureextractionalgorithmwasimproved.Inthisdessertation,theunsuper

7、visedfeatureextractingprincipalcomponentanalysisalgorithmandsupervisionofFisherdiscriminantanalysisalgorithmisprofoundlystudied,basedonwhich,itisdemonstratedthatfromtheangleofdatareconstructionanddata

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。