浅谈交互式开放语义知识库构建方法研究

浅谈交互式开放语义知识库构建方法研究

ID:34776090

大小:1.18 MB

页数:62页

时间:2019-03-10

浅谈交互式开放语义知识库构建方法研究_第1页
浅谈交互式开放语义知识库构建方法研究_第2页
浅谈交互式开放语义知识库构建方法研究_第3页
浅谈交互式开放语义知识库构建方法研究_第4页
浅谈交互式开放语义知识库构建方法研究_第5页
资源描述:

《浅谈交互式开放语义知识库构建方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文交互式开放语义知识库构建方法研究ACOLLABORATIVEMETHODONASSOCIATIONSEMANTICKNOWLEDGEBASECONSTRUCTION崔磊哈尔滨工业大学2009年12月国内图书分类号:TP391.9学校代码:10213国际图书分类号:621.3密级:公开工学硕士学位论文交互式开放语义知识库构建方法研究硕士研究生:崔磊导师:王晓龙教授副导师:陈清财副教授申请学位:工学硕士学科、专业:计算机科学与技术所在单位:深圳研究生院答辩日期:2009年12月授予学位单位:哈尔滨工业大学Cla

2、ssifiedIndex:TP391.9U.D.C:621.3DissertationfortheMasterDegreeinEngineeringACOLLABORATIVEMETHODONASSOCIATIONSEMANTICKNOWLEDGEBASECONSTRUCTIONCandidate:CuiLeiSupervisor:Prof.WangXiaolongAssociateSupervisor:AssociateProf.ChenQingcaiAcademicDegreeAppliedfor:Masterof

3、EngineeringComputerScienceandSpeciality:TechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:December,2009Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要随着自然语言处理技术不断发展,语义知识库资源推陈出新,应用越来越广泛。现有的语义知识库建设主要有两种:一种是基于语言学家的人工构造方法,一种是基于特定框架

4、的自动标注方法。前者虽然准确、严谨,但是周期太长,规模很难扩大,后者则面临知识库准确性、合理性验证的难题。另外,目前的语义知识库资源绝大多数仍是相互独立的,存在着知识通用性不足、资源重复、合理利用率较低等缺陷。为了有效解决这样的问题,本文提出了一个构建大规模、带有语义标注的开放的语义知识库的方法。构建的知识库满足下面的要求:在知识库中,类别作为主要的描述对象,具有基本属性和语义属性;类别信息决定了条目的内容及其组织形式,条目是基本单位,其存在和描述以类别为依存;每个条目都可以具有符合其含义的多个类别。提取知识库的类别属

5、性,是知识库自动构建的重要内容。为获取类别的语义属性,本文将HowNet与以Wikipedia为代表的百科全书融合,在保留Wikipedia中的丰富资源及其知识框架的同时,将HowNet中的语义信息赋予给了知识库中的类别。类别基本属性的获取,关系到类别对类别下词语条目内容的总体规划,是影响到整个语义知识库内容与结构组织的重要因素,也是整个知识库构建工作的重中之重。本文首先提出了基于目录词的义类属性提取及约简算法。然后在此基础上利用粗糙集理论,提出了基于容错粗糙集模型的义类属性提取算法。经实验表明,本文提出的两种义类属性

6、提取算法均具有较高的准确率,基于容错粗糙集模型的义类属性提取算法能够更加准确地提取词条的属性标签信息,基本满足了用户对知识库类别的基本属性的要求。关键词:语义知识库;属性提取;Wikipedia;HowNetI哈尔滨工业大学工学硕士学位论文AbstractAgreatdealofinformationisdistributedontheInternetwithvariousforms,howtofindcomprehensiveandaccurateinformationhasalwaysbeenthegoalofma

7、nynetworkapplications.Searchenginescouldsatisfyusers’informationneedinsomecertaindegreebyimplementingsimplekeywordsforretrieval.However,informationneeditselfisusuallytoocomplicatedtobeexpressedwithwords,sentencesorevenparagraphs.Inrealworld,somemeanssuchasclassi

8、ficationandcomparisoncouldhelppeoplefindoutwhattheyreallywant,whichisunavailableforsearchengines.Inthetraditionalsearchengine,wealwaysusethekeywordsasthecontentoftheq

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。