大数据环境下传统文化知识图谱构建方法研究

大数据环境下传统文化知识图谱构建方法研究

ID:33582446

大小:5.46 MB

页数:80页

时间:2019-02-27

大数据环境下传统文化知识图谱构建方法研究_第1页
大数据环境下传统文化知识图谱构建方法研究_第2页
大数据环境下传统文化知识图谱构建方法研究_第3页
大数据环境下传统文化知识图谱构建方法研究_第4页
大数据环境下传统文化知识图谱构建方法研究_第5页
资源描述:

《大数据环境下传统文化知识图谱构建方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得云洼王些太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:触签字日期.卅瞬/月嘶学位论文版权使用授权书本学位论文作者完全了解丞洼王些太堂有关保留、使用学位论文的规定。特授权丞洼王些太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇

2、编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)导师签名.知吁签字日期:沙I降f月(伯%』日争翠_、惦月厂、7丁,名年签f者",饵叫文期沦日位字学签万方数据学位论文的主要创新点fIIIIIIIIIIHIllIJrlllrll$111rdUJY2757568一、结合中国传统文化特征,将文本类的传统文化资源概念化、结构化,构建了由事件、人物、时间、地点、社会背景、文化领域六元组组成的中国传统文化本体模型。以“事件”概念表明文化的动态性和发展性,将“时间”和“地点”作为时空维度来承载并呈现中国传统

3、文化知识体系中的“事件"、“人物”和“文化领域”关联关系。二、充分考虑中文表述习惯和特点,提出了基于上下文模式的面向文化领域的实体及其关系的抽取算法。该算法通过设计的候选特征词规则库、上下文模式生成规则库、模式泛化规则库,实现了关系特征词抽取、关系特征词聚类和关系模式挖掘,为上下文实体间关系的半自动化抽取提供了支持。实例验证本算法的抽取性能较高,为提高知识库构建效率奠定了基础。三、搭建了基于Hadoop的中国传统文化知识图谱集成平台,实现了文化数字化和资源共享。该平台由知识抽取层、数据存储层、数据控制层、查询处理层、应用接口层和展示层组成,集成了传统文

4、化本体模型管理、知识抽取模型管理和知识图谱展示等核心功能。平台具有良好的外部接口和较强的实用性。万方数据摘要近年来,随着我国经济的快速发展,人们生活水平显著提高,文化消费需求持续增长,为文化产业带来前所未有的发展机遇,但我国传统文化资源利用效率较低,文化服务形式相对落后,与社会的发展和人们的消费需求不相适应。大数据环境下,传统文化数字化资源不断丰富,为文化数字平台建设提供了海量数据资源。中国传统文化知识图谱的构建方法研究能够为挖掘我国丰富的文化资源、实现文化服务形式创新和文化资源共享提供技术支持,因此,本文具有重要的理论意义和现实意义。本文立足于大数据

5、时代背景,以中国传统文化为研究对象,基于Hadoop分布式处理系统和MapReduce相关理论知识,研究了中文知识图谱构建方法、本体建模方法、中文分词方法以及大数据处理方法和技术。在梳理中国传统文化知识体系的基础上,建立了基于大数据环境的中国传统文化知识图谱构建框架,构建了由事件、人物、时间、地点、社会背景、文化领域六元组组成的中国传统文化本体模型。以中国传统文化本体模型为基础构建了基于Hadoop分布式系统和Hbase非关系型数据库的中国传统文化知识库。本文设计了基于Hadoop分布式系统的传统文化知识抽取模型,该模型包括基于Nutch的数据抓取算法

6、、基于CRF模型的实体抽取方法和基于上下文模式的关系抽取算法等,实现了知识库实例自动填充。最后,以中国传统文化本体模型为核心元素,以知识抽取模型为实现手段,以知识库为底层数据基础构建了由知识抽取层、数据存储层、数据控制层、查询处理层、应用接口层和展示层组成的中国传统文化知识图谱集成平台。该平台充分考虑大数据环境特征,运用Hadoop分布式系统,集成了本体管理、知识抽取、知识库管理和知识图谱展示等核心功能,设计了良好的外部接口,实现了传统文化数字化、文化服务形式信息化和文化资源共享,为数字文化战略提供了平台支持。关键词:大数据:中国传统文化;Hadoop

7、;中文知识图谱;知识抽取万方数据ABSTRACTInrecentyears,withtherapiddevelopmentofoureconomy,livingstandardsimprovedsignificantly,andtheculturalconsumptiondemandcontinuestogrow.Itbringstheunprecedenteddevelopmentopportunityforculturalindustry,butChinesetraditionalcultureresourcesutilizationefficie

8、ncyisstilllowandculturalservicefornlisrelativel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。