欢迎来到天天文库
浏览记录
ID:34042044
大小:2.78 MB
页数:80页
时间:2019-03-03
《军事情报的无监督文本聚类研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号UDC密级1934519学位论文军事情报的无监督文本聚类研究与实现作者姓名:孙恺指导教师:李景宏副教授申请学位级别:学科专业名称:论文提交日期:学位授予日期:评阅人:硕士学科类别:专业学位计算机技术2008年12月2日论文答辩日期:2008年12月25日2008年月日答辩委员会主席:东北大学2008年12月AThesisinComputerTechnologyResearchandRealizationonUnsupervisedTextClusteringofMilitaryInformationbySunKaiSupervisor:Assoc
2、iateprofessorLiJinghongNortheasternUniversityDecember2008_j独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:0m腱j日期:砌孑.t2..盯学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机
3、构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口两年口学位论文作者签名:签字日期:导师签名:签字日期:’跫}4f畸,ll『、,II,1I,l●,‘.,-东北大学硕士学位论文摘要军事情报的无监督文本聚类研究与实现摘要军事情报领域对信息转化为情报的要求非常高,但是由于大量信息的复杂及其多样性,导致情报的数据挖掘比较困难。本文采用数据挖掘中非常重要的文本聚类方法来,研究并设计了军情报加工处理系统,提高对军事情报的收集、
4、处理、分析的效率。文本聚类是自然语言处理一个重要的研究课题,文本聚类技术已经广泛地应用于信息检索、Web挖掘和数字图书馆等领域。本文介绍了目前国内外关于文本聚类的研究现状,阐述了几种具有代表性的文本聚类方法,分析了它们的理论基础和算法特点,并在军事情报这一特殊领域进行了试探性的拓展。本文研究了文本聚类中的几种特征选取方法,指出每种方法的优缺点,提出一种基于知网的概念抽取方法,结合知网知识库,将文本中的词映射为知网中的概念。针对词语的一词多义的现象,从全文的角度考察词的语义,结合知网相关概念场,将词义排歧转化为对相关概念场中的词在全文中出现频率的计算。通
5、过将语义分析引入到文本聚类的任务中,在语义相关的文本之间建立联系,将词的频度和语义特征相结合,降低特征空间的维数,提高文本聚类的质量。同时,采用无监督的词簇聚类技术改进传统的基于词的文本聚类方法,该方法不仅有效地解决了文本聚类的高维问题,而且通过将近义词进行聚类表示较好地解决了多词一义的问题,该方法在针对相对专业的真实军事语料的评测工作中取得了较好的效果,为文本的语义聚类做出了更深的研究探索工作。为军队的信息化建设做出了一定的努力和贡献。关键词:军事情报;文本聚类;知网;相似度:、■‘‘Jl、^}。●,1l●●J,■ResearchandRealiza
6、tiononUnsupervisedTextClusteringofMilitaryInformationAbstractThefieldofmilitaryintelligenceneedsahighdemandofintelligenceinformation,butbecauseofthelargeamountofinformationandcomplexdiversity,leadingtotheintelligencedataminingmoredifficult.Inthispaper,usingthetextclusteringwhich
7、isaveryimportantmethodinthedatamining,researchanddesignthemilitaryinformationprocessingsystermtoincreasethemilitaryintelligencecollection,processing,analysisofefficiency.Documentclusteringisanimportantresearchtopicofnaturallanguageprocessingandiswidelyapplicableinareassuchasinfo
8、rmationretrieval,webmimnganddigitallibrary.This
此文档下载收益归作者所有