基于事件框架主题相关文档智能检索的研究和实现

基于事件框架主题相关文档智能检索的研究和实现

ID:34628118

大小:941.75 KB

页数:76页

时间:2019-03-08

基于事件框架主题相关文档智能检索的研究和实现_第1页
基于事件框架主题相关文档智能检索的研究和实现_第2页
基于事件框架主题相关文档智能检索的研究和实现_第3页
基于事件框架主题相关文档智能检索的研究和实现_第4页
基于事件框架主题相关文档智能检索的研究和实现_第5页
资源描述:

《基于事件框架主题相关文档智能检索的研究和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文摘要网络的飞速发展使得对高质量的Web文本信息检索的需求变得空前的迫切。而要提高检索系统的性能,除了改进和提高检索方法的性能,还必须加强对主题相关信息的收集和加工,以获得有效的检索资源。本文对面向用户兴趣文档的主题相关信息的智能检索进行了研究,其宗旨是进一步提高Web信息检索的服务质量,主要内容包括事件相关文档的检索和事件重要信息的抽取与集成。取得了以下一些研究成果:第一、提出了一种自动获取事件框架的方法。首先,建立灾难性事件的统一框架;然后在统一框架的基础上使用BootStrapp

2、ing方法获取关键词;最后通过对相关句子进行聚类得到最终的框架知识结构。将框架应用到与主题相关检索有效地降低其他事件的干扰,使事件相关文档的检索性能明显提高。第二、实现了一个事件关键信息的抽取与集成系统,本系统具有如下特色:(1)在进行事件抽取时,首先利用句型模板构造抽取规则,然后直接从经过基本短语识别、时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度;(2)利用框架间的相似性,提高资源重用度。(3)利用事件的规范化的时空信息关联不同文档中的同一事

3、件,实现了事件合并,并提出按时间流顺序的线索性文件抽取的输出方式。第三,系统地分析了中文机构名的特点与命名实体识别在机构名识别上的诸多难点,提出统计和规则相结合的中文机构名识别法。即采用统计的方法在训练语料库中获取机构名知识库,然后根据机构名特点设计了机构名识别的规则。在统计与规则的结合下获得了较好的机构名识别效果。第四,本文集成了灾难性事件信息检索和信息抽取系统。将信息检索与信息抽取结合起来为用户提供更精确、更容易阅读的信息服务。关键词:智能检索;事件框架;信息抽取;事件合并;命名实体识别I基于事

4、件框架的主题相关文档智能检索研究与实现ABSTRACTTheInternetisexplodingwithplentyofresources.HenceitcomestobeurgenttoadvancethestudyofWebtextinformationretrieval(IR)withhighqualityreturnedresult.While,thecapabilityofretrievalsystemnotonlydependsonimprovingandadvancingretrie

5、valmethodbutalsoreliesongatheringandprocessingtopic-relevantinformationthatcanprovideefficientretrievalresource.InordertoachievebetterqualityofWebinformationretrievalservice,thisthesisorientedtodocumentsattractingusersfocusesonresearchofintelligentretr

6、ievalfortopic-relevantinformation.Themaintaskinvolvegatheringevent-relevantdocuments,andextractingandintegratingeventkeyinformation.Therearesomeresultsasfollowing:First,presentanunsupervisedmethodofgatheringeventframe.WebuiltunitedCalamityEventframe;th

7、enweusedBootStrappingmethodbasedonunitedeventframetogatherkeywords;lastly,applyclusteringtechniquestoextracteventframestructure.Applyingeventframeonretrievaloftopic-relevantcanreduceinterferenceofsimilareventandimproveperformanceofretrievalsystem.These

8、cond,implementasystemthatcanextractandintegratekeyinformationofeventbecomespractical.Thenewfeaturesofthesystemareasfollows:(1)Extractionrulesarebuiltbysentencepatternaseventinformationisextracted,theneventinformationisdirectlyextractedf

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。