基于web文本的文物知识图谱自动生成方法研究

基于web文本的文物知识图谱自动生成方法研究

ID:35059070

大小:5.98 MB

页数:69页

时间:2019-03-17

基于web文本的文物知识图谱自动生成方法研究_第1页
基于web文本的文物知识图谱自动生成方法研究_第2页
基于web文本的文物知识图谱自动生成方法研究_第3页
基于web文本的文物知识图谱自动生成方法研究_第4页
基于web文本的文物知识图谱自动生成方法研究_第5页
资源描述:

《基于web文本的文物知识图谱自动生成方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:TP39110697分类号学校代码:201320933密级:公开学号:NorthwestUniversity?-.硕±亨恆巧交'.MASTERSDISSERTATION基于Web文本的文物知识图譜自动生成方法研究追.;斧't’尋.’.V會..'斗-.义..句'如户■-P34:学科义称:计算机应用技术作者:邱超指导老师:张蕾教授西北大学学位评定委员会二〇—六年六月AutomaticKnowledeGrahGenerati

2、onforgpCulturalRelicsfromWebTextA化esissubmi行edtoNorthwestUniversityinartialfill巧llmentofthereuirementspqforthedereeofMasterginComuterAlicationTechnolopppgyByQiuChaoSuervisor:ZhanLeiProfessorpgJune2016西北大学学位论文知识产权声明书本人完全了解

3、西北大学关于收集、保存、使用学位论文的规定。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。本人授权西北大学可[^将本学位论文的全部或部分内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研巧所等机构将本学位论文收录到。《中国学位论文全文数据库》或其它相关数据库保密论文待解密后适用本声明。学位论文作者签名;応指导教师签名;確f年居月I的年^月/中曰西北大学学位论文独创巧汚明本人声明;所呈交的学位论文

4、是本人在导师指导下进行的研究工作。及取得的研巧成果据我所知,除了文中特别加W标注和致谢的地方外,本论文不包含其他人己经发表或撰写过的研究成果,也不包含为获得西北大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名;評獲>01(年^月/今曰摘要随着互联网的发展和人们对搜索引擎智能化需求的増加,各领域知识的组织、存储和检索成为关键技术。不少学者通过构建领域知识图谱的方法来揭示领域知识之间的联系,为智能化的搜索

5、提供知识基础,取得了较好的成果。因此本文提出了面向文物领域的知识图谱自动生成方案,具体研巧内容如下;(1)首次将持征词集的思想融合到文物知识点抽取规则生成算法中。首先识别出待抽取信息,然后将其上下文词语与特征词集匹配,,生成初始规则最后进行规则泛化。该方法减少了规则生成部分的人工干预成分,在同样准确率的前提下提高了工作效率。(2)首次采用规则和极限学习机(ExtremeLearningMachine,ELM)相结合的文。物知识点抽取算法充分利用了文物知识点描述的规则性,又吸收了ELM算法训练速度

6、快的优点,实验结果表明该方法与单纯基于规则巧基于分类方法相比,平均F值分别提升了7.22%和4.01%。与基于条件随机场(ConditionalRandomFields,CRF)和支持向量机(SupportVectorMachine,SVM)相结合的算法相比准确率相当,但模型训练速度是它的2倍。(3)提出了基于联合索引的资源描述框架(ResourceDescriptionFramewo出RDF),文物知识点存储方法。充分利用了文物分布局部性和文物知识点构词层次性特点,通过设计文物属性索引,实现了文物知

7、识点的快速检索。实验结果表明该方法的平均检索速度是基于六索引的RDF存储方式的1.55倍,是基于H级H索引的RDF存储方1式的.42倍。(4)提出了面向文物领域知识图谱自动生成算法。通过不断查找具有相同属性值的文物进行图谱扩充,并在查找相同属性值文物的过程中充分利用了文物四大属性索弓。该,,减I算法具有较强的鲁棒性和扩展性少了人工干预对于构建其他领域知识图谱具有借鉴意义。W上研究内容,实现了面向文物领域知识图谱的自动生成方案,并验化了该方案的有效性。:知识图谱关键词,文物知识点,规则抽恥ELM算法,

8、联合索引IABSTRACTWiththedevelopme凸tof也eInternet化chnologymoreintellientsearchenineswillbe,ggpro

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。