欢迎来到天天文库
浏览记录
ID:34134761
大小:7.00 MB
页数:62页
时间:2019-03-03
《基于bootstrapping的领域知识自动抽取技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP391密级:公开单位代码:学号:⑧∥菇办写10422200912946硕士学位论文论文题目:基于Bootstrapping的领域知识自动抽取技术的研究THESTUDYONAUTOMATICALDOMAIN-SPECIFICKNOWLEDGEEXTRACT10NFROMWEBSITESBASEDONBOOTSTRAPPING作者姓名学院名称专业名称指导教师合作导师康琪计算机科学与技术学院计算机系统结构马军教授2012年4月20日原创性声明和关于论文使用授权的说明糯原创性声明本人郑重声明:
2、所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:逮壅日期:叫?o沙关于学位论文使用授权的声明本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检
3、索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密论文在解密后应遵守此规定)论文作者签名:盈丝导师签日期:型!墨:I加.,tL一,≯Ⅵ弋。日山东大学硕士学位论文目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.IAbstract⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.III第l章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯i1.1论文研究背景及意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.iI.2国内外发展和研究现状⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯.41.3论文研究的主要内容⋯⋯⋯⋯
4、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.7i.4论文的组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..8第2章Web信息抽取相关技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.92.1基于自然语言处理的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..92.2基于模式匹配的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..102.3基于网页结构的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..122.4基于ZML结构的信息抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯142.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.15第3章DKEW算法描述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
5、⋯⋯.163.1基本技术与定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.163.1.1标签路径技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.163.1.2属性——值⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯183.1.3领域种子⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..193.1.4领域本体⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..193.2DKEW整体框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯203.3DKEW算法设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯243.3.1基于中心的聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.243.3.2模式学习⋯⋯⋯
6、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..283.3.3知识抽取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..333.3.4Ontology扩展⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯353.3.5Bootstrapping⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35第4章实验分析与讨论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..37山东大学硕士学位论文4.1实验设置⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.374.2性能评估⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.384.3效率评估⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.39第5章结论与展望⋯⋯⋯⋯⋯
7、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4l参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯47攻读学位期间发表的学术论文目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..48山东大学硕士学位论文AbstractinChineseAbstractinEnglish...,ChapterlIntroductionTABLEOFCONTENTS1.1BackgroundandSignification1.2CurrentResearchStatus⋯⋯一1.3MainStudy
8、Content1.4PaperFrameworkandChapterArrangementIII.1Chapter2RelatedW6rksofWebInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1NLPBasedInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.2PatternDiscoveryBasedInformationExtraction⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.3PageSt
此文档下载收益归作者所有