基于bootstrapping的领域知识自动抽取技术的研究

基于bootstrapping的领域知识自动抽取技术的研究

ID:34134761

大小:7.00 MB

页数:62页

时间:2019-03-03

基于bootstrapping的领域知识自动抽取技术的研究_第1页
基于bootstrapping的领域知识自动抽取技术的研究_第2页
基于bootstrapping的领域知识自动抽取技术的研究_第3页
基于bootstrapping的领域知识自动抽取技术的研究_第4页
基于bootstrapping的领域知识自动抽取技术的研究_第5页
资源描述:

《基于bootstrapping的领域知识自动抽取技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391密级:公开单位代码:学号:⑧∥菇办写10422200912946硕士学位论文论文题目:基于Bootstrapping的领域知识自动抽取技术的研究THESTUDYONAUTOMATICALDOMAIN-SPECIFICKNOWLEDGEEXTRACT10NFROMWEBSITESBASEDONBOOTSTRAPPING作者姓名学院名称专业名称指导教师合作导师康琪计算机科学与技术学院计算机系统结构马军教授2012年4月20日原创性声明和关于论文使用授权的说明糯原创性声明本人郑重声明:

2、所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:逮壅日期:叫?o沙关于学位论文使用授权的声明本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检

3、索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密论文在解密后应遵守此规定)论文作者签名:盈丝导师签日期:型!墨:I加.,tL一,≯Ⅵ弋。日山东大学硕士学位论文目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.IAbstract⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.III第l章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯i1.1论文研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.iI.2国内外发展和研究现状⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯.41.3论文研究的主要内容⋯⋯⋯⋯

4、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.7i.4论文的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..8第2章Web信息抽取相关技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.92.1基于自然语言处理的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..92.2基于模式匹配的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..102.3基于网页结构的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..122.4基于ZML结构的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯142.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.15第3章DKEW算法描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5、⋯⋯.163.1基本技术与定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.163.1.1标签路径技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.163.1.2属性——值⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯183.1.3领域种子⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..193.1.4领域本体⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..193.2DKEW整体框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯203.3DKEW算法设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯243.3.1基于中心的聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.243.3.2模式学习⋯⋯⋯

6、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..283.3.3知识抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..333.3.4Ontology扩展⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯353.3.5Bootstrapping⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35第4章实验分析与讨论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..37山东大学硕士学位论文4.1实验设置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.374.2性能评估⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.384.3效率评估⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.39第5章结论与展望⋯⋯⋯⋯⋯

7、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4l参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯47攻读学位期间发表的学术论文目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..48山东大学硕士学位论文AbstractinChineseAbstractinEnglish...,ChapterlIntroductionTABLEOFCONTENTS1.1BackgroundandSignification1.2CurrentResearchStatus⋯⋯一1.3MainStudy

8、Content1.4PaperFrameworkandChapterArrangementIII.1Chapter2RelatedW6rksofWebInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1NLPBasedInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.2PatternDiscoveryBasedInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.3PageSt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。