欢迎来到天天文库
浏览记录
ID:11568490
大小:48.50 KB
页数:24页
时间:2018-07-12
《扩展知识图谱上的实体关系检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、----------------------------------最新精选范文公文分享-----欢迎观看-----------------------------------------------扩展知识图谱上的实体关系检索摘要:现有文本数据集上的实体搜索和自然语言查询方法无法处理需要将分散在不同文档中的信息碎片链接起来以满足有复杂实体关系的查询,而知识库上的查询虽然可以表示实体间的复杂关系,但由于知识库的异构性和不完全性,通常查全率较低。针对这些问题,提出使用文本数据集对知识库进行扩展,并设计相应的含文本短语
2、的三元组模式查询以支持对知识库和文本数据的统一查询。在此基础上,设计并实现了查询放松机制和对结果元组的评分模型,并给出了高效的查询处理方法。使用YAGO、ClueWeb09和其上的FACC1数据集,在三个不同的查询测试集上与两个典型相关工作作了比较。实验结果显示,扩展知识图谱上使用查询放松规则的实体关系检索系统的检索效果大大超出了其他系统,具体地在三个查询测试集上,其平均正确率均值比其他系统分别提升了27%、37%和64%以上。中国论文网http://www.xzbu.com/8/view-7316903.htm
3、 关键词:知识图谱;实体关系检索;实体搜索;三元组模式查询;查询放松 中图分类号:TP391.3文献标志码:A--------------------------------------------最新精选范文分享--------------谢谢观看------------------------------------------------------------------------最新精选范文公文分享-----欢迎观看-------------------------------------------
4、---- 0引言 近年来,随着从文本中提取结构化数据的信息抽取技术[1]日益成熟,大规模知识库的构建得到了迅猛发展,产生了许多形形色色的知识库,如DBpedia、Freebase、YAGO、Wikidata、NELL、Probase、GoogleKG和MicrosoftSatori等[2]。这些机器可读的知识大多被表示成三元组形式的资源描述框架数据,描述实体、实体分类以及实体和实体之间的各种关系等,被广泛应用在文本分析、自然语言理解、机器阅读、语义搜索、自然语言问答等各类智能型的应用中。例如,Google、百度
5、、Bing等搜索引擎正积极构建大型知识图谱,并利用知识图谱改善其搜索效果,如生成结构化的结果摘要、实体推荐、实体搜索和自然语言问答等。 在知识图谱上进行自然语言问答的通常做法是先将自然语言问题理解成确切的结构化查询,如SPARQL查询,然后再在知识库上执行该查询而获得确切答案。例如,如果要找出所有影片和它们的插曲,而知识库中又有music_in_film这样一个song类型实体和movie类型实体之间的关系,则可以将此信息需求理解成以下SPARQL查询: 程序前-------------------------
6、-------------------最新精选范文分享--------------谢谢观看------------------------------------------------------------------------最新精选范文公文分享-----欢迎观看----------------------------------------------- 程序后 然后在知识库上执行该查询就可以得到所有影片和它们的插曲。 理解成确切的SPARQL查询的方法查准率高,但查全率却较低。这主要是由于知识库的
7、异构性和不完全性造成的。1)异构性:同一语义在自然语言中有多种表达方式,在知识图谱上同样可以有许多不同的存在方式。例如,有些电影和它们的插曲之间的关系可能不是用一个直接的music_in_film关系表示的,而是存在一个has_soundtrack关系连接电影和其电影原声带,以及一个contains_song关系连接电影原声带和其中的乐曲等。2)不完全性:知识库中的信息是不完全的。规模再大的知识库也有缺失信息,如有些影片和其插曲的信息在知识库中不存在。造成信息缺失的原因有很多种,如信息抽取的精度没达到阈值等。 针
8、对知识库的异构性和不完全性所带来的问题,本文提出使用文本数据来补充知识库的信息,并实现二者的统一查询。不同于一般的实体检索返回实体列表,本文主要考虑的是实体间具有较复杂关联关系的实体关系查询,返回的结果是实体元组列表。具体地,问题定义如下:给定一个知识库和文本数据集,如何查询才能有效满足用户提出的复杂信息需求。------------------------
此文档下载收益归作者所有