欢迎来到天天文库
浏览记录
ID:35065393
大小:1.97 MB
页数:73页
时间:2019-03-17
《基于改进入侵野草算法的文本特征选择研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10289分类号:TP391.1密级:公开学号:132070028江苏科技大学硕士学位论文基于改进入侵野草算法的文本特征选择研究研究生姓名丁雪导师姓名高尚申请学位类别工学硕士学位授予单位江苏科技大学学科专业软件工程论文提交日期2015年12月31日研究方向语义网与Web技术论文答辩日期2016年03月26日答辩委员会主席李永忠评阅人盲审盲审2016年3月20日分类号:TP391.1密级:公开学号:132070028工学硕士学位论文基于改进入侵野草算法的文本特征选择研究学生姓名丁雪指导教师高尚教授江苏科技大学二〇一六年三月AThesis
2、SubmittedinFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringAnImprovedInvasiveWeedOptimizationAlgorithmforTextFeatureSelectionSubmittedbyDingXueSupervisedbyProfessorGaoShangJiangsuUniversityofScienceandTechnologyMarch,2016江苏科技大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下
3、,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:年月日摘要现在计算机与网络的相关技术飞速发展,人们面前出现了数量难以衡量的文本信息,每个人都能坐在家中便知晓天下事。但是随着资源量的增大,想要从这么多文本信息资源中迅速找到自己需要使用的部分,变得愈发艰难,数据挖掘技术随之诞生,而文本分类又是数据挖掘中一个十分关键的研究焦点和核心技术。在文本分类中,文本特征
4、选择是其中的关键技术和核心问题,对于信息检索的效率和正确率的提高有极大的作用。2006年伊朗德黑兰大学的A.R.Mehrabian和C.Lucas在《EcologicalInformatics》杂志上发表的论文《Anovelnumericaloptimizationalgorithminspiredfromweedcolonization》中首次提出入侵野草算法。它是作者在受到野草生长繁殖过程的启发之后提出的一种基于种群数值优化的算法,它在执行过程中模仿野草扩散、生长、繁殖和竞争性生存的基本过程,算法在种群进化过程的早期和中期能够维持其多样性,
5、从而更全面搜索解空间。算法在后期集中搜索优秀个体的附近区域,使之可以逐步地收敛到全局内的最优解。目前的技术还远远无法做到让计算机能够像人一样进行思考,能够阅读和理解文本的中心思想,然后通过归纳总结正确选择出文本的特征词条,而当前主流的方法都是按照某种计量函数来得出各词条在所在文本中的相关函数值,从大到小排列后选取靠前的若干词条,如此一来,某些相关函数值较低,但其实蕴藏更多有效信息的词条就被忽略了。为了更有效地进行文本特征的选择,增强选择精度,本文在一种基于标准入侵野草算法的文本特征选择方法基础上,先对特征种群初始化的方法加以优化,然后采用一种改
6、良的入侵野草算法,即引入自适应小生境算法,对种群施以分类竞争繁殖,增加种群的多样性,提高该算法的全局寻优能力,并在算法的后期采用自适应小生境数提高收敛精度,希望借此增加文本特征选择的正确率,获得较好的分类结果。同时进行仿真实验与其他现有的方法进行对比,从而进一步证实入侵野草算法与文本特征选择结合的可能性,同时完善基于该算法的文本特征选择技术,为文本分类的研究提供一种便捷高效的方法。关键词:文本特征;特征选择;入侵野草算法;小生境IAbstractNowtherelevanttechnologyofthecomputerandnetworkdev
7、elopsrapidly,peoplefaceahugenumberoftextinformation.Everyonecansithome,knowingwhat'sgoingonintheworld.However,withtheincreaseofresource,itisbecomingmoreandmoredifficulttofindwhatyouneedfromsomuchtextinformationresources.Thedataminingtechnologywasborn,andtextclassificationisa
8、veryimportantresearchhotspotandkeytechnologyindatamining.Intextclassificati
此文档下载收益归作者所有