欢迎来到天天文库
浏览记录
ID:35131886
大小:3.86 MB
页数:75页
时间:2019-03-19
《试析基于主题的事件融合技术的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、苏州大学硕士学位论文基于主题的事件融合技术的研究与实现姓名:孙中友申请学位级别:硕士专业:计算机软件与理论指导教师:李培峰20100401基于主题的事件融合技术的研究与实现中文摘要随着互联网的快速发展,网络上关于某一主题的新闻报道呈爆炸式增长,大量的事件信息存在冗余、不完整、不一致、有歧义现象。如何能快速准确地获得某一主题详细而完整的信息是一个需要解决的问题。本文就主题事件的融合问题进行了研究。本文提出了多源不完备元事件信息融合的方法,该方法针对事件信息存在不完整、歧义及重要信息丢失的现象,提出基于统计的元素补齐算
2、法;通过对已有的事件相似度算法及聚类算法进行改进,提出了基于分组融合的同指元事件融合方法,该方法有效地解决了互斥信息、互补信息、冗余信息的融合问题。本文提出了基于主题的事件融合处理方法,该方法通过基于互信息的事件聚类算法,有效得对基于主题的事件进行融合,同时提出基于事件的摘要生成方法和基于摘要的层次聚类算法,可以获得结构化,时序化的主题事件形式。实验表明,本文不完备元事件信息融合方法可以有效合并事件信息,大大降低了信息系统的冗余度,有效完善了不完整事件信息,通过对多源信息的冗余性和互补性进行融合,达到增加目标特征矢
3、量的维数、降低信息的不确定性及改善信息的置信度等目的。基于主题的事件融合不仅能有效地将相关事件联系起来,并能将整个主题以层次化、结构的形式表示。关键词:事件信息抽取,事件融合,不完备信息处理,事件聚类作者:孙中友指导老师:李培峰AbstractResearchandImplementationofTopic-BasedEventFusionResearchandImplementationofTopic-·BasedEventFusionWiththerapiddevelopmentoftheIntemet,the
4、informationaboutcertaintopicshasbeenincreasingexplosively.Duetotheredundancy,incompleteness,inconsistenceandambiguityoftheelementinformation,itbecomesanurgentonhowtoacquirethedetailedandcompleteinformationuponacertaintopic.Thispaperfocusesonthetopiceventfusion
5、,andthemainfruitsarelistedasfollow:Firstly,thispaperexploresthefusionofmulti—sourceandimperfecteventinformation.Inrelatedtotheabsenceandincompletenessoftheeventinformation,astatisticsbasedelementsupplementapproachisproposed.Ontheimprovementofthecurrentelements
6、imilarityandclusteringalgorithm,therecallandaccuracyontheelementclusteringalealsoraised.Thenitproposesameta-elementgroupfusionstrategy,whichCaneffectivelysolvethefusionofexclusive,complementaryandredundantinformation.Secondly,wedeal、析ththetopiceventfusion,andp
7、roposeaclusteringalgorithmonwordCO-occurrenceelement.Byincorporatingthetopicbasedelementseffectively,itproposestheabstractgenerationmethodbasedontheelement,aswellasthehierarchicalclusteringalgorithmbasedonabstracts,andproducesthestructuredandtemporalformalized
8、elements.Theexperimentalresultsshowthattheeventfusionmethodisusefultofusetheeventmentionsandorganizetherelativeevents.ItCanreducetheinformationredundancysharplyandthenconsummatethe
此文档下载收益归作者所有