信息提取技术概述_上_

信息提取技术概述_上_

ID:34610501

大小:300.70 KB

页数:5页

时间:2019-03-08

信息提取技术概述_上__第1页
信息提取技术概述_上__第2页
信息提取技术概述_上__第3页
信息提取技术概述_上__第4页
信息提取技术概述_上__第5页
资源描述:

《信息提取技术概述_上_》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、·语言信息处理·信息提取技术概述!上"’孙斌(北京大学)关键词:信息提取;消息理解会议!"#$%;自然语言处理摘要:本文试图对信息提取作一比较全面的概述,以期使读者对它有一个较为综合的了解。内容包括信息提取的含义、技术目标、实际背景和现状,以及其中涉及到的主要技术环节、工程内容和难点等。并由此明确信息提取作为一门语言应用工程技术的定位和实际工作策略。!"#$$%&’(%)’*+*,-+,*&$%)’*+./)&%0)’*+(1)!"#$%&2345*&6788925+0-)&59:;)+-<)&59=>*((-

2、/*?9.*+()-9.&9/4592*+*9<*(,>?43=@-)A+-BC-9/A-/*D+5<*((&9/!97)&%0)8%1&(’-’*+-))*0’)()5’+*(*9)-<50’+*1*9(&E*(A00-+&F-)&59-9.A9.*+()-9.&9/52&925+0-)&59*;)+-<)&59G&9

3、-B<59)*9)(-(J*BB-(*9/&9**+&9/.&22&

4、究和实现文本信息的自动滤或提取出来,一直是一个比较紧迫的实际问查找、收集汇总和存储,以期把人们从大量、低题。相应地,各种帮助人们查找、分类和存储信效的文本阅读劳动中解放出来。这是对信息提息的理论、技术、应用工具和系统始终在不断地取概念的首次真正意义上的实践。这一时期也发展和更新,并保持着旺盛的活力。近年来,一正是自然语言处理理论和应用开始发生“范式种叫做信息提取的技术逐渐受到了人们的关变化”,’-+-.&/0(1&2)3的时侯,即从以4150(67注,信息提取的提出和兴起有着特定的时代背等为代表的“纯理性范式”

5、转变为日益强调以对景。"$世纪#$年代后期,美国政府提出了一个!"#!·语言信息处理·真实文本数据的统计分析和经验知识归纳为主统的输出结果与标准答案比较,按一定的评价要方法的范式。这种趋势还同计算机处理能力指标给出所有系统的评测结果,其中最主要的不断提高和文本数据积累不断增大密切相关。指标是准确率、查全率等。当前,由:;-定义的尊重真实文本语言已成为当前各种信息处理技概念、模型和技术规范在国际上对整个信息提术(包括信息提取)的一个基本立场和出发点。取领域起着主导的作用。在第G次和第F次正是在这种信息化浪潮的推动

6、下,西方发:;-上,还增加了中文系统的评测项目。台湾达国家都十分重视信息提取技术的研究和应大学的一个系统(-H’.’+53I##)参加了用,把它列为与信息检索、文档归类和摘要、语:;-2F,测试了中文命名实体(人名、地名、时音识别等并重的语言工程项目。美国多所大间、事件等名词性短语)的识别,取得了与英文学、公司和研究机构都对此展开了有计划的、长命名实体识别系统相近的性能。当然,这只是对期系统的研究与应用工作,并且有专门的机构中文信息提取作了比较初步的工作,并不能真组织各种评测活动,对当前的研究进展进行评正进行中

7、文信息提取。遵照:;-规范的完整的估,例如著名的:;-<:’9957’;.=’09+5.=%.7中文信息提取系统目前尚未见报道。-*.1’0’.>’?、:@$(:A3+%3%.7A53@.+%+B$59C)、本文以下部分试图对信息提取的主要方面$D@-($’E+D’+0%’/53-*.1’0’.>’9)等。日本、西欧作一比较全面的概述。首先对信息提取这个新各国也报道了大量的有关信息提取的研究工的术语进行界定,然后考察其中涉及的具体技作,并在大规模电子词典的研制、基础资源收集术内涵,进而讨论其中涉及到的若干基础性

8、的等方面为深入的研究开发打下了基础。由于信课题,并结合作者的部分工作对中文信息提取息提取是一门综合的技术,它需要比较深入的的具体技术作一说明。语言处理基本理论和技术作为支撑。二、什么是信息提取尤其值得一提的是:;-。它是美国政府支持的一个专门致力于真实新闻文本理解的例为了对信息提取的概念有一个比较清楚的会,至今已举行F届。除像一般的学术会议一样界定,让我们先讨论一个假想的例子。设想有一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。