基于中文百科的概念知识库构建

基于中文百科的概念知识库构建

ID:36438989

大小:5.06 MB

页数:68页

时间:2019-05-10

基于中文百科的概念知识库构建_第1页
基于中文百科的概念知识库构建_第2页
基于中文百科的概念知识库构建_第3页
基于中文百科的概念知识库构建_第4页
基于中文百科的概念知识库构建_第5页
资源描述:

《基于中文百科的概念知识库构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:!殴21密级:垒在.单位代码:!Q兰篁学号:垄!兰21壁坌量洳}:土淳硕士学位论文⑧英文论文题目!塾星一ConstructionofKnowledgeBase’。。。●______-l__-___●___-__l●__--__●●__l--__●-_一——————————————————___-_l●__一作者姓名王龙亩指导教师昙江茎副教拯学科(专业)让箕扭廑旦撞本一提交日期至Q!墨生!目旦日ADisertationSubmittedtoZhejiangUniversityfortheDegreeofMasterofEngineering⑧TITL

2、E::!h皇gQn曼主!堕Q主iQ里Q£KnQ婴1金鱼g皇旦垦墨皇b鱼墨金鱼Q坠gh主旦Q兰鱼星卫鱼YQlQ卫金鱼i鱼Author:Supervisor:盟坠.Ii垫旦ggi旦College:一ComputerScienceandTechnology.SubmittedDate:..~2Q1.墨么!也独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得逝姿态鲎或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对

3、本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:掰签字同其j了:办d年与月¨同学位论文版权使用授权书本学位论文作者完全了解逝’江盘堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿态堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:、劫浦导师签名:签字日期:莎。r年弓月f【日签字日期:采7川:rt月工岁h、:萎坼浙江大学硕士学位论文摘要近年来,移

4、动互联网、物联网、云计算等技术迅猛发展,网络应用层出不穷,引发了网络数据的爆炸式增长。如何从大规模数据中获取有价值的知识并对其进行深入的计算和分析成为了当前研究的热点。目前,世界上已有的知识库中大部分都是以英文维基百科或其他英文资源为基础构建的。中文百科(百度百科、互动百科和中文维基百科)涵盖规模大、覆盖率高、更新速度快,具有很高的研究价值。本文致力于构建一个基于中文百科的知识库,根据实际需求重点做了以下几个工作:(1)百科网页爬虫及网页分析:本文以广度优先的方法下载百科开放分类和词条的链接,然后使用多线程的策略下载网页内容;通过分析网页结构特征,利用启发

5、式规则等方法从网页中抽取出语义信息。(2)概念层次结构构建:本文提出了一种从互动百科开放分类体系中构建概念之间的层次结构的方法,通过提取开放分类的语言规则特征和语义特征,以决策树分类器作为基分类器,训练Adaboost模型抽取百科开放分类之间的上下位关系,构建概念层次结构;使用同样的方法抽取百科分类与词条之间的上下位关系,确定分类的实例。(3)属性值抽取:本文使用条件随机场的方法抽取属性值。首先从百科网页中抽取出信息框属性和属性值,用它们来学习得到训练数据集及需要抽取的属性集,然后使用关键字匹配的方法从词条正文中抽取得到候选句子,最后训练条件随机场模型从候

6、选句子中抽取属性值。本文以互动百科开放分类体系为基础初步构建了概念层次系统,并且以互动百科“人物”分类下的词条为数据集进行属性值抽取实验,取得了良好的效果。关键词:上下位关系,条件随机场,属性值,知识库,百科浙江大学硕士学位论文AbstractInrecentyears,developmentsofmobileIntemetareinfullswing,InternetofThings,cloudcomputingandothertechnologies,networkapplicationsemergingoneafteranother,networkd

7、atawitnessedexplosivegrowth.Facingsuchalargeamountofdata,howtoderivevaluableknowledgeandmakefulluseofitwithdeepcalculationandanalysishasbecomeahotresearchtopic.Currently,differentcountrieshavebuiltasmanyas50kindsofknowledgebase,mostofwhicharebasedonEnglishWikipediaorotherEnglishre

8、sources.ActualIy,Chineseencyclope

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。