欢迎来到天天文库
浏览记录
ID:33693726
大小:7.00 MB
页数:75页
时间:2019-02-28
《基于信息抽取社会网络的构建技术地地研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要近年来,如何利用海量数据的分析来协助犯罪调查和防止犯罪发生的对策研究已成为执法部门和情报部门面临的重要难题。研究者们对目标对象相关数据的统计学分析、结构化目标对象相关数据的挖掘、社会网络的分析方法等数据分析方法上进行了广泛的研究。其中,在用于分析目标对象间的相互关系,紧密程度等方面,社会网络分析的方法逐渐得到了认可。社会网络分析的方法是通过构建社会网络,用节点表示目标对象,连线来表示关系,分析与挖掘目标对象的信息、心理行为等规律,找到隐藏线索,挖掘出目标对象社会网络中的重要节点和潜在的结构,从信息分析的层面协助执法部门或情报部门对事件进行调查。随着信息网络的高速发
2、展,非结构化信息的不断增多,信息分析难度呈几何级数的增加,以往通过结构化的数据构建社会网络的方法已经不适合动态多变的海量信息了。而从大量的非结构化或半结构化目标对象相关数据中抽取信息并构建可视化目标对象社会网络,掌握目标对象关系网络的结构对于处理犯罪案件具有十分重大的意义。本论文将信息抽取技术与本体论相结合运用于目标对象关系网络的构造,研究一种新的面向非结构化信息抽取的社会网络构建方法。采用信息抽取技术从非结构化或者半结构化的文本中,提取目标对象社会网络构建需要的内容,并以结构化的形式,例如XML文档或关系数据库形式保存下来。最终,提供给社会网络可视化工具,进行可视化
3、展示和社会网络分析,协助执法部门或情报部门分析目标对象的社会网络关系。目前,在非结构化信息抽取技术上仍然有很多困难。其中,采用统计学习方法的信息抽取系统,非常依赖特定领域的训练文本,训练文本的涵盖范围直接影响到信息抽取的准确度。而更传统的采用模式匹配方法的信息抽取系统,由于其模式匹配的技术局限性,只能针对特定的实体类型和实体关系进行抽取,模式较为死板,不具备通用性,特别是在实体关系抽取上面临比较大的难度。本论文引入基于本体的信息抽取技术。通过对目标对象社会网络的需求分析,构建目标对象适合的本体,结合本体进行本体实例的构造,最终完成信息抽取并生成符合社会网络可视化结构的
4、XML文档。结合科研课题提供的目标对象相关数据,进行信息抽取,社会网络的构造,并根据信息抽取的召回率和准确率来评判目标对象社会网络构建的可行性。实验结果表明,本文研究的基于信息抽取的社会网络构建技术,能够有效地从非结构化文本中目标对象的I广东工业大学硕士学位论文信息,关系并构建可视化网络,对分析目标对象的社会关系提供帮助。在这个框架的基础上可以通过扩展本体,对更多目标对象领域进行非结构化信息的抽取构建领域网络结构。关键词:信息抽取本体社会网络构建IlAbstractAbstractInrecentyears,theuseofmassivedataanalysistoa
5、ssistincriminalinVestigationsandcountermeasurestopreventtheoccurrenceofcrimehasbecomeasignificantchallengeswhichlawenforcementandintelligenceagenciesface.Statisticalanalysisofcrimedata,crimedatastructureofmining,socialnetworkanalysismethodsbeenwidelystudied.Thesocialnetworkanalysisinter
6、msofnetworkcharacteristicsfortheanalysisofcrimeincreasinglyrecognized.Bybuildingcriminalnetworks,withnodesthatcriminalelements,torepresenttheconnectionbetweenanalysisandmininginformationoncriminals,psychologicalbehavior,law,findhiddenclues,diggingouttheimportantnodesinthecriminalnetwork
7、sandthepotentialstructurecanassistcriminalinvestigations.Withthegrowingnumberofunstructuredinformation,informationanalysiSandthedifficultyincreasesexponentially,thestructureddatatoconstructsocialnetworksapproachwhichisinthepasthasbeennotsuitableforadynamicandvastamountsofinform
此文档下载收益归作者所有