公安犯罪案件文本挖掘关键技术研究

公安犯罪案件文本挖掘关键技术研究

ID:33290274

大小:2.75 MB

页数:64页

时间:2019-02-23

公安犯罪案件文本挖掘关键技术研究_第1页
公安犯罪案件文本挖掘关键技术研究_第2页
公安犯罪案件文本挖掘关键技术研究_第3页
公安犯罪案件文本挖掘关键技术研究_第4页
公安犯罪案件文本挖掘关键技术研究_第5页
资源描述:

《公安犯罪案件文本挖掘关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浙江大学计算机学院硕士学位论文公安犯罪案件文本挖掘关键技术研究姓名:程春惠申请学位级别:硕士专业:计算机应用技术指导教师:何钦铭20100101浙江大学硕士学位论文摘要由于信息技术的快速发展,公安信息系统中积累了海量的业务信息。面对着日益庞大的公安信息量,迫切需要应用人工智能的相关技术,对数据进行深层次的分析并研究各类信息的规律和关系,以更好地打击犯罪、防控犯罪。因此,将数据挖掘技术有效地应用于犯罪分析是目前公安工作的迫切需要。文本挖掘技术是近几年来数据挖掘领域的一个新兴的分支。而在海量案件信息中,除了规范化程度很强的数据库

2、数据外,还有大量的案件叙述性文本描述。对这些大量的案件文本进行相关文本挖掘技术研究和应用是非常有意义的。本文主要针对公安领域中大量的犯罪案件文本信息,对其中的案情文本挖掘相关技术进行研究和应用。本文论文的工作包括以下几点:(1)在文本预处理方面。结合实际应用需要,对公安业务中的一些术语建立专业词库;同时针对案件文本的特征,提出了具有针对性的特殊预处理方法。(2)在案件特征选择方面。根据实际应用的需求,研究了六种特征选择算法,并通过比较六种特征选择算法,确定了对案情文文本挖掘有利的特征选择算法。(3)在案件分类挖掘方面。提出了

3、案件属性信息抽取方法和同义词语义分析方法,并在此基础上提出了改进的案件相似度计算方法;根据犯罪案件文本类别不均衡的特征,改进了朴素贝叶斯中的多变量贝努里模型,提出了面向不均衡类别的改进朴素贝叶斯案件文本分类方法。(4)在应用系统设计方面。设计和实现了一个典型三层C/S结构的犯罪案件文本挖掘系统,实现了相似犯罪案件文本检索模块和犯罪案件文本分类模块。关键词:文本挖掘,文本分类,文本相似度计算,数据挖掘,犯罪挖掘,中文分词,特征选择浙江大学硕士学位论文AbstractDuetotherapiddevelopmentofinfor

4、mationtechnology,publicsecurityinformationsystemhasaccumulatedvastamou.ntsofbusinessinformation.Inthefaceofincreasinglylargeamountofpolicesecurityinformation,weurgentlyneedAIrelatedtechnologieswhichanalysisofthedatain—depth,researchthelawsofvariouskindsofinformatio

5、nandrelationshipsinordertObettercombatcrime,crimepreventionandcontr01.Therefore,dataminingtechnologyiseffectivelyappliedtocrimeanalysisistheurgentneedforpublicsecuritywork.Textminingtechnologyisaemergingbranchofdataminingforthepastfewyears.Inthemassivecaseinformati

6、on,inadditiontoastrongdegreeofstandardizationofthedatabasedata,therearealargenumberofcasesofnarrativetextdescriptions.Textminingtechnologyresearchandapplicationonthemassivetext·casemormationisverymeaningful.Inthispaper,wedosomeresearchandapplicationoftextminingtech

7、nologyonthemassivetext-cases.T11ispaper’Sworkincludesthefollowing:(1)Inthetextpre-processingaspects.Combinationofpracticalapplication,thispaperestablishesprofessionalpoliceterminologythesaurusandexploresthespecialtextpreprocessingmethodaccordingtothefeatureofcasete

8、xt.(2)Inthecasefeatureselectionaspects.AccordingtOtheneedsofpracticalapplications,thispaperresearchesthesixkindsoffeatureselectionalgorithm.Andby

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。