欢迎来到天天文库
浏览记录
ID:27912501
大小:63.12 KB
页数:4页
时间:2018-12-07
《技术检测中的信息抽取技术的应用分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、技术检测中的信息抽取技术的应用分析ApplicationAnalysisoftheInformationExtractionTechnologyofTechnologyDetection胡立诺游HULi-nuo曰胡立岩于HULi-yan(淤迁安市质量技术监督局,迁安064400;于迁安市园林绿化管理局,迁安064400)(淤Qian’anAdministrationofQualityandTechnologySupervision,Qian'an064400,China;于Qian'anLandscapingAutho
2、rity,Qian'an064400,China)摘要院木文主要讲述了对于信息抽取技术的研究从它的概念,和它具体应用的分析,到最后的如何运用做了简单的介绍以及在信息抽取的过程中所涉及到的自然语言处理技术和中文信息抽取具有怎样的目的,任务和技术。Abstract:Thispapermainlystudiesthetechnologyofinformationextractionfromperspectivesofspecificapplication,howtoapplyandtheobjectives,tasksand
3、technologiesoftheinvolvednaturallanguageprocessingtechnologyandChineseinformationextractionintheprocessofinformationextraction.关键词院新闻;获取信息;信息的检索Keywords:news;obtaininformation;informationretrieval中图分类号院G202文献标识码院A文章编号院1006-4311(2014)21-0236-020引言随着社会经济不断的发展,各种各样
4、的新闻也在不断地增加,随着互联网的发展,每天不断产生大量数据文件,同时还要对这些文件进行交流和处理。但是在实际需求中,人们往往不能在这些众多文件中,迅速将自身所需信息寻找出来,所以,如何能够快速准确地从众多的网络信息中来获取到自己所需要所感兴趣的信息就成为了一个主要的问题。1对于信息抽取的简单描述信息抽取的技术属于是信息处理技术之一,其主要是依照之前己经设计好的模板,将人们所需求的信息从木结构或者是非结构化文木中进行提取。例如对于一条网络新闻来说,则就要对这条新闻的类型、发生吋间以及发生地点等信息进行抽取。这样实施信息
5、抽取,不但可以对人们找到自己所感兴趣所需要的信息提供帮助,冋样也能够对K•信息内容进行一定的处理和总结,从而提高人们寻找自己感兴趣信息速度,并获取与自己所感兴趣的信息所相关的一些信息。并且还能在这个基础上进一步对数据的挖掘,文本的生成等信息做后续的处理。这种信息提取技术的发展在各种新闻量增长的当代具奋非常重要的应用价值。所以这项技术也越来越受到人们的重视。2对信息抽取的主要情况的分析随着新闻的越来越多,人们所需要信息量也会越来越大,这就对加速信息检索到了一定的作用。对于信息的抽取是从某一段的文字中抽取出所需要的事件或者
6、事实等,并将这些指定吋间或者事实的抽取而形成的一种数据,填入到信息抽取技术系统的数据库中,这样也就为用户的信息查询提供方便。实施信息抽取的主要0的就是能够在网络中将自己所指定要找的文件信息找到,同时也将和自己制定文件信息相关的内容获取。比如说在计算机网络中,想要对某一种设备的名称、用途以及生产厂家等信息进行抽取,那么对于互联网IE任务来说,则也就是将这一设备的相关信息和内容从其在线文本中进行抽取,将在预先设计好中模板中进行填写完成。对于特定的互联网IE系统的任务和通用的自然语言理解和任务是不一样的。对于通用自然语言来说
7、,系统的输入必须是对输入的句子做透彻的分析,苏中包括其输入句子的本身意义及隐含意义。通常我们会把自然语言进行两步理解,其一就是分析输入句子,将其在一个句法结构中进行映射,这一方式被称为句法树;其二则是对其进行句法和句义之间的转换,将其在句法意义中进行映射表达。在一个特定的互联网IE中,从一段的文本中抽取出指定的事件或者事实等,并将这些指定事件或者是事实抽取所形成的结构化数据,在提取信息数据库中进行填写,为用户对自己所需要的全部信息查询提供方便。当然其所抽取的信息,也必须将其事先进行设计。因此只有携带冇相关短语的句子,就
8、能够被进行解释,输入文本也能够将其有限数0分类吋间进行映射。比如在搜索凶杀事件和爆炸事件等中。所以对语义进行完全句法式的分析解释,是完全没有意义的,主要对于文章进行片段性分析即可。信息抽取技术系统主要的就是以模板框架做为中间点,从而把信息抽取的技术分成两个阶段,分别是选择和生长阶段。苏中模板框架可以看成是一张申请单,其采用空槽形式
此文档下载收益归作者所有