探索粗糙集理论在中文文本分类中的应用

探索粗糙集理论在中文文本分类中的应用

ID:34784356

大小:3.37 MB

页数:117页

时间:2019-03-10

探索粗糙集理论在中文文本分类中的应用_第1页
探索粗糙集理论在中文文本分类中的应用_第2页
探索粗糙集理论在中文文本分类中的应用_第3页
探索粗糙集理论在中文文本分类中的应用_第4页
探索粗糙集理论在中文文本分类中的应用_第5页
资源描述:

《探索粗糙集理论在中文文本分类中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谣南交通大学研究生学位论文粗糙集理论在中文文本分类中的应用年姓级二oO二级名杜卫锋申请学位级别博士专业恕唯一鼬唏删指导教师多薹多教授二oo六年四月西南交通大学博士研究生学位论文第1页摘要随着数据的爆炸式增长,信息处理已经成为人们获取信息和知识不可或缺的工具。文本分类是信息处理的重要研究方向,它是指在既定的分类体系下,根据文本的内容自动判别文本类别的过程。本文对文本分类中所涉及的关键技术,包括向量空间模型、实值词频向量模糊化、基于粗糙集理论的知识获取、知识库中规则强度的计算、各规则分类结果不一致时的冲突消解等内容进行了研究和探讨,并给出了该方法与其它分类方法的复杂度比较,最后应用该方法实现了

2、一个文本分类系统,获得了分类准确程度方面的实验结果。本文的研究内容主要包括以下两个方面:一.基于粗糙集理论的知识约简研究1.Skowron区分矩阵的改进。对Skowron区分矩阵中元素应满足的条件作了改进,使得对条件的判断较原来更为简单,并且满足该条件的元素较原来更少,有效降低了借助区分函数计算知识约简的复杂度:2.各种知识约简方法相互关系的研究。对于决策表,人们从不同的角度出发,提出了正域约简、熵约简、分布约简、分配约筒、近似约简等约简理论与方法。本文证明了熵约简与分布约简等价,而对于协调决策表,正域约简、熵约简、分布约筒、分配约简、近似约简相互等价;3.知识约简的逻辑特征。决策表中的知

3、识体现为规则的形式,可以理解为非经典逻辑系统中的公式,本文借助逻辑手段研究知识约简的逻辑特征,证明了在熵约简与分布约简之下,决策表约简前后所获得的规则是等价的。二.粗糙集理论在文本分类中的应用研究1.本文结合仅对一维空间进行划分的特点,对FCM算法进行了调整,使其能得到两相模糊数弱划分的结果,并将语言值引入规则,提高了知识的简洁性和可理解性,为人参与知识库的分析与修正提供了方便;2.对应用粗糙集理论获取的规则提出了一种计算规则强度的方法,该方法综合考虑规则对应的实例数、规则与实例的匹配度以及规则前件的长度,为分析规则库中规则的重要性程度提供了一个指标,方便了不一致结果的冲突消解,使得分类结

4、果更加准确有效:3.在以上研究工作基础上,设计并实现了基于粗糙集理论的文本分类系统,经过查全率和查准率比较,分析了本文提出的文本分类系统的特点,并给出了冲突消解策略。美键词数据挖掘;粗糙集;模糊聚类i文本分类;向量空间模型第1I页西南交通大学博士研究生学位论文AbstractAstheexplosiveincrementofdata,informationprocessinghasbecometheindispensabletoolforpeopletoacquireinformationandknowledge.Textcategorizationistheimportantresear

5、chfieldofinformationprocessing.Itistheprocessofautomaticallydeterminingthecategorizationofsometextaccordingtothecontentoftext,whichisundertheestablishedcategorizationsystem.Thispaperhasmadesomeresearchanddiscussionaboutthecriticalpointoftextcategorization,includingVectorSpaceModel,thefuzzification

6、ofrealvaluedwordfrequencyvector,knowledgeacquisitionbasedonroughset,thecomputationofrulestrengthinknowledgebase,theconflictresolutionwhendisagreementamongtheresuhsoftherelatedrulesandSOon,moreover,thecomplexitycomparisonwithothermethodofcategorizationisgiven.Inaddition,werealizeatextcategorization

7、systemwiththemethod,whichacquirestheexperimentalresultofthecategorizationaccuracv.ThemaincontentiSlistedhere:PartOne:KnowledgereductionresearchbasedOnroughsettheory1.TheimprovementofSkowrondiscemibilitymatrix.The

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。