北京大学计算机系计算语言所

北京大学计算机系计算语言所

ID:45935431

大小:367.50 KB

页数:76页

时间:2019-11-19

北京大学计算机系计算语言所_第1页
北京大学计算机系计算语言所_第2页
北京大学计算机系计算语言所_第3页
北京大学计算机系计算语言所_第4页
北京大学计算机系计算语言所_第5页
资源描述:

《北京大学计算机系计算语言所》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、孙斌北京大学计算机系计算语言所(icl.pku.edu.cn)文本信息提取技术(概述)内容(1)信息提取的含义、目标(2)信息提取技术中若干相关基础问题(3)(中文)信息提取系统的流程与设计(4)Web信息提取1、“信息提取”的含义举例说明:什么是信息提取设想有一个用户,他关心《人民日报》中出现的一类特定的信息,即会议信息。属于“单纯信息”:无相互关联、时序条件、因果等。通常他是一篇一篇地看报,把其中报道会议的所有段落标记出来,然后对每一个会议信息填写如下一个表格(或者称其为“会议信息模板”):

2、会议信息(填写预定义语义的表格)会议时间Time会议地点Spot召集人Convener姓名/团体名称Name机构、职位Org/Post会议名/标题Conf-Title会议信息一例会议报道(例1):人民日报1998-03-09新华社北京3月8日电(记者李术峰):中国农工民主党第十二届中央常务委员会第一次会议今天在北京召开。会议研究通过了贯彻落实“两会”精神的有关决定,审议通过了中国农工民主党中央1998年工作要点(草案),并任命了中央副秘书长。农工民主党中央主席蒋正华主持了会议,他说,农工民主党有

3、100多名党员作为代表和委员参加了今年的“两会”,各位党员要认真履行代表和委员的职责,开好会,在1998年的工作中认真贯彻“两会”精神,加强农工民主党的自身建设,推动事业进一步发展,为建设有中国特色社会主义事业作出新的贡献。会前,农工民主党中央邀请参加“两会”的来自全国各省、自治区、直辖市的农工民主党党员进行了联谊活动。会议时间Time1998年3月9日会议地点Spot北京会议召集者/主持人Convener个人姓名/团体名称Name蒋正华机构、职位Org/Post主席,农工民主党中央会议名/标题

4、Conf-Title中国农工民主党第十二届中央常务委员会第一次会议ICL.CS.PKU系统输出结果:会议报道(例1)事件模板实例北京蒋正华中国农工民主党第十二届中央常委员会第一次会议会议报道(例2):人民日报1998-01-0719980107-06-

5、016-001意大利总理普罗迪4日说,欧洲国家将采取行动,共同对付库尔德难民涌入问题。普罗迪4日晚召开了由意外长、内政和国防部长参加的紧急会议,商讨应付库尔德难民问题的对策。会前,普罗迪说,“在经过最初的混乱后,欧洲国家的行动已经大大加强”,今后几天内将在此问题上进行系统合作。会议报道(例2):汉语分词、标注、短语分析19980107-06-016-001/m意大利/ns总理/n普罗迪/nr4日/t说/v,/w欧洲/ns国家/n将/d采取/v行动/vn,/w共同/d对付/v库尔德/nr难民/n涌

6、入/v问题/n。/nx{{{MP[0,0]PersonNP[1,3]TimeNP[4,4]VP[5,5]XP[6,6]LocationNP[7,7]NP[8,8]XP[9,9]VP[10,10]NP[11,11]XP[12,12]XP[13,13]VP[14,14]VP[17,17]NP[18,18]XP[19,19]}}}普罗迪/nr4日/t晚/Tg召开/v了/u由/p意/j外长/n、/w内政/n和/c国防部长/n参加/v的/u紧急/a会议/n,/w商讨/v应付/v库尔德/nr难民/n问题/n

7、的/u对策/n。/nx{{{PersonNP[0,0]TimeNP[1,2]VP[3,3]XP[4,4]PP[5,5]NP[6,6]PostNP[7,7]XP[8,8]NP[9,9]XP[10,10]PostNP[11,11]VP[12,12]XP[13,13]AP[14,14]NP[15,15]XP[16,16]VP[17,17]VP[18,18]XP[22,22]NP[23,23]XP[24,24]}}}会前/t,/w普罗迪/nr说/v,“/w在/p经过/p最初/b的/u混乱/an后/f,/

8、w欧洲/ns国家/n的/u行动/vn已经/d大大/d加强/v”,/w今后/t几/m天/q内/f将/d在/p此/r问题/n上/f进行/v系统/n合作/v。/nx{{{TimeNP[0,0]XP[1,1]PersonNP[2,2]VP[3,3]XP[4,4]PP[5,5]PP[6,6]AP[7,7]XP[8,8]NP[9,9]XP[10,10]XP[11,11]LocationNP[12,12]NP[13,13]XP[14,14]NP[15,15]XP[16,16]XP[17,17]VP[18,18

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。