基于文本情报的数据挖掘-吕曹芳

基于文本情报的数据挖掘-吕曹芳

ID:36650046

大小:651.10 KB

页数:4页

时间:2019-05-13

基于文本情报的数据挖掘-吕曹芳_第1页
基于文本情报的数据挖掘-吕曹芳_第2页
基于文本情报的数据挖掘-吕曹芳_第3页
基于文本情报的数据挖掘-吕曹芳_第4页
资源描述:

《基于文本情报的数据挖掘-吕曹芳》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第20卷第6期电脑与信息技技术术2012年Vol.1220月No.62012年12月ComputerandInformationTechnologyDec.2012文章编号:1005-1228(2012)06-0032-03基于文本情报的数据挖掘吕曹芳,侯智斌(解放军陆军军官学院一系,安徽合肥230031)摘要:文章介绍了适合于军事领域中进行情报数据的挖掘方法,建立了军事情报中非结构化文本情报数据处理方法,结合军事情报的特点,提出了军事情报中数据挖掘的框架模型,探讨了军事情报挖掘中文文本的方法。实现了对情报文本数据的分词、关键字提取、词频分析、关联分析等。关键词:数据挖掘;军

2、事情报;关联分析;分类分析中图分类号:TP311文献标识码:ADataMiningRealizationTechnologyBasedonTextIntelligenceDataLVCao-fang,HOUZhi-bin(FirstDepartment,ArtilleryAcademyofPLA,Hefei230031,China)Abstract:Thispaperintroducesintelligencetextclassificationmodelinmilitary,thedataprocessingmapofunstructuredintelligencetext

3、isestablished.Dataminingmodelframeworkisestablishedfirstlybythefeatureofmilitaryintelligence.AndimplementsChinesewordsegmentationontextdata,keywordextraction,wordfrequencyanalysis,relationalanalysis.Keywords:datamining;militaryintelligence;relationalanalysis;classificationanalysis当今,信息的实时处理

4、及其有效的利用,已经成为关联规则分析法,是从数据预处理之后形成的事夺取控制信息权的关键。而信息战的成败也将会直接务数据库中挖掘出满足给定条件的关联数据。关联规则影响战争的胜负,信息已经渗透到战场的众多领域,包分析法形式如“M1→M2,支持度=S%,置信度=C%”,其括有形的战场、无形的战场。指挥员们面对海量的数中s和c是用户指定的支持度和置信度的阈值。据,如何过滤冗余、无用的信息,及时、准确的获取有用聚类或分类分析法,是对数据进行分类,把具有同的相关信息。并且军事情报存在相当数量的采用文本样特点的数据归为一类,找出类的模型,再利用这些类[4]形式表示的信息,这些文本所存放的数

5、据库,就称为情的模型对新的数据分类分析。报数据库或文档数据库。情报数据库中所存放数据大分布与趋势预测分析法,是从数据中发现潜在的都是半结构化的数据,即它们既不是完全结构化也不数据发展的趋势,从而有利于数据的处理,弥补没有或[5-6]是完全无结构的。如何能够快速、及时的对这些半结构遗漏数据。化的数据进行处理,获取它们背后隐藏的规则。本文将2数据挖掘技术在军事情报中的应用数据挖掘技术引入到军事情报分析模块,并运用适合的挖掘技术对大量的情报进行分析,将有利于军事情数据挖掘技术可以从海量数据中提取隐含的、潜报分析处理方法的进一步改进。在有用知识,在军事领域有大量的情报是以文本的形式存

6、在。因此,将挖掘文本数据的技术应用到军事情报1数据挖掘技术领域,能够节省指挥员分析情报的时间及减少人为分数据挖掘(DataMining,DM)技术可以帮助用户从析情报的误差。庞大的的数据中获取非显性的、潜在的有用信息,从而2.1军事领域中数据挖掘框架结构图[1-3][7]为用户决策提供依据。数据挖掘的常用方法主要包数据挖掘技术主要是面向应用的。本文结合数据括:关联规则分析法,聚类或分类分析法,分布与趋势挖掘技术在其他领域中的体系结构特点,给出了数据预测分析法。挖掘在军事领域中的框架结构,如图1所示。在该框架收稿日期:2012-08-22作者简介:吕曹芳(1979-),女,安徽

7、寿县人,讲师,硕士,研究方向:数据挖掘。侯智斌(1984-),山西晋中人,讲师,硕士,研究方向:数据处理。第20卷第6期吕曹芳等:基于文本情报的数据挖掘·33·[10-11]结构中主要分三大模块:需求分析模块、预处理和挖掘过程。模块及应用选择模块。需求分析模块,是根据作战需求文本关联是指从文本集合中找出不同词语之间的确定分析领域。预处理和挖掘模块,是根据挖掘领域数联系。用户可以以关键字词集合代替每个文档进而通过据的特点及选定的挖掘技术对相关数据进行预处理,用关键字自动标识文档。用户可以根据实际情况给出得

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。