欢迎来到天天文库
浏览记录
ID:37329663
大小:17.84 MB
页数:156页
时间:2019-05-22
《中文文本中事件时空与履性信息解析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Ph.D.DissertationInterpretationofEventSpatio-—temporalandAttributeInformationinChine,。7一xtnese1extByZhangChunjuSupervisedbyProf.ZhangXueyingProf.JiGenlinKeyLabofVirtualGeographicEnvironmentMinistryofEducation,NanjingNormalUniversityMay,2013学位论文独创性声明~嬲
2、炒必螋本人郑重声明:所提交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果。本论文中除引文外,所有实验、数据和有关材料均是真实的。本论文中除引文和致谢的内容外,不包含其他人或其它机构已经发表或撰写过的研究成果。其他同志对本研究所做的贡献均已在论文中作了声明并表示了谢意。学位论文作者签名:球春蚤日期:确怠,上,3/学位论文使用授权声明研究生在校攻读学位期间论文工作的知识产权单位属南京师范大学。学校有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的部分或全部内容,可以采用影印
3、、复印等手段保存、汇编本学位论文。学校可以向国家有关机关或机构送交论文的电子和纸质文档,允许论文被查阅和借阅。(保密论文在解密后遵守此规定)保密论文注释:本学位论文属于保密论文,密级:——保密期限为年。学位论文作者签名:歌舂萄指导教师签名:了侈季煲日期:锄B.太eJ日期:珈幺.支.3f资助项目国家高新技术研究发展计划“863’’课题“泛在空间信息关联更新与面向主题时空信息挖掘研究’’(2012AAl2A403)江苏省研究生创新计划项目“Web文本中灾害事件信息挖掘方法研究”(CXLXn...087
4、4)摘要本文依托国家“863”课题“泛在空间信息关联更新与面向主题时空信息挖掘研究”,较为系统地探索中文文本中事件时空与属性信息解析方法,为泛在空间信息动态关联更新,全球统一时空框架下的空间信息与知识服务提供数据和技术支持,同时为事件时空模式挖掘奠定数据基础,进而为事件风险评估、公共安全等重大问题提供决策服务。本文针对中文文本中事件时空与属性信息描述的非结构化、定性化和不确定性等特点,围绕“文本描述.规范化表达.结构化抽取.可视化重构”的技术主线,重点研究事件时空与属性信息解析方法。主要研究内容与
5、结论包括以下几个方面:(1)事件时空与属性信息的结构化表达:通过归纳总结中文文本中事件时空与属性信息描述的语言特征和语义结构,设计了事件时空与属性信息的知识表达框架和标注体系;以突发公共事件为例,以网络文本为数据源,基于GATE平台构建了中文文本中事件时空与属性信息标注语料库,为事件时空与属性信息抽取研究提供了标准化训练和测试数据。(2)事件时空与属性信息抽取:分析中文文本中时间信息描述的规律性,实现了基于触发词和规则模型结合的时间信息抽取、推理和规范化解析,准确率、召回率和F值分别达到75.00
6、%、88.24%和40.54%;利用条件随机场模型和规则模型,实现了事件名称识别和空间位置(包括地名和空间关系)信息抽取,其中事件名称识别准确率、召回率和F值分别为82.08%、80.18%和81.12%;设计了基于Bootstrapping的事件属性信息抽取算法,量词性的属性信息抽取准确率和召回率达到80.80%和85.16%。(3)时空驱动的事件分类方法:通过分析事件时空认知和表达特性,提出一种融合时间、空间、属性、事件名称、触发词汇等多种上下文语义和语境信息的事件分类方法。按照句子、段落、篇
7、章三个语言单元等级,探讨了事件替代性名称的推理方法。实验结果表明,事件分类准确率在封闭和开放测试中分别达到92.30%和80.60%。(4)事件时空信息匹配与可视化:以地名数据库为空间数据源,提出了定性时空信息(地名、空间关系和时间信息)的匹配和可视化表达方法,探索了基于“时间.空间一概念类型”多重一致性约束的主题事件判断和时空过程重构方法,实现了事件信息在时空信息系统中有机的、直观的可视化表达,并对事件时空信息分布模式进行了聚类分析。研究结果表明,采用规则模型和统计模型结合的方式可以有效实现中文
8、文本中摘要事件时空与属性信息抽取,但是特征项的设置在统计模型的学习过程中起到举足轻重的作用;不同类型事件的时间、地名、空间关系、事件名称和类型等信息抽取模型具有通用性和可移植性,而属性信息存在较大差异,需要针对具体类型事件构建相应知识库和学习模型;事件类型判断存在灵活、复杂、语义模糊、不确定性特点,且属于多标记分类,融合词性、触发词汇、时间、空间、属性和事件名称等多种上下文语义和语境信息,可以有效提高事件分类效果;空间数据的覆盖范围和数据质量,以及空间关系解析模型,对事件时空与属性
此文档下载收益归作者所有