欢迎来到天天文库
浏览记录
ID:35039291
大小:4.16 MB
页数:51页
时间:2019-03-16
《中文短文本实体识别和链接研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号密级IIDC缩号中為火葦f挺考硕±学位途义中文短文木卖体识别,翁>和健接研藥学位申请入姓名:罗星申请学位学生类别:全巧制硕去申请学位学科专业:计算机应巧技求指导教师姓名:黄漸袭教援___'MASTERSTHESIS硕±学位论文中文短文本实体识别和链接研究论文作者:罗星指满狮:劳相冀教授胡巧副教授学科专业:计算机应用技术研究方向:自然语言处理华中师范大学计巧fl学院2016年05月一硕壬学位论文
2、MA'STERSTHESISEntityRecognitionandLinkinginChineseShortTextAThesisSubmittedinPartialFulfillmentoftheReuirementqfortheMS.DegreeinComputerApplicationTechnologyByXinLuogPostgraduateProgramSchoolofComputerCentralChina
3、NormalUniversitySuervisor:XianiHuan,PoHupgjgAcademicTitle:ProfessorAssociateProfessorSignature,ApprovedMa2016y,一/p^巧壬学位论文'HESMASTERSTIS华中师苑大学学位论文原创枝声明和使用授权说明居刮性吉巧本人郑重声明;所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含
4、任何其他个人或集体己经发表或撰写过的研巧成果。对本文的研究做出贡献的个人和集体,均已在文中明确方式标明。。本声明的法律结果由本人承担作者签名:至曰期;必年^月曰/学侄冷文化枚使用援权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被査阅和借阅;、学校可W公布学位论文的全部或部分内容,可W允许采用影印缩印或其它复制手、汇编学位论文
5、)段保存。(保密的学位论文在解密后进守此规定。保密论文注释:本学位论文属于保密,在_年解密后适用本授权书非保密论文注释:本学位论文不属于保密巧围,适用本授权书。^作者签名:;导师签名'曰期:年月曰曰期:06月{曰《7/1片I""本人己经认真阅读CALIS髙校学位论文全文数据库发布章程,同意将本人的""""CALIS髙校学位论文全文数据库中全文发布学位论文提交,并可按章程中的一:□半巧规定享受相关权益。同竟论义据々后滞后:□年:□二年巧布。作者签名;导师签若:曰期:《/^月
6、曰曰期:)/年/:占月I目f*V/Si^硕壬学位论文MA'STERSTHESIS巧要随着社会的信息化进程,人们对自然语言语义理解系统的需求越来越迫切。目前基于命名实体的研究成为了语义研究的热点。本文研究了中文短文本的命名实体识别(NER)和实体链接(EL),考虑这两个任务的相关性,采用了联合处理这两个任务的方式。实体识别和链接是文本分析的基本任务,是许多自然语言任务的基础支撑模e一块。现有方法大多使用pipline模式执行这两个任务。通常先使用个NER系统寻找命名实体
7、的边界一,然后使用个EL系统关联命名实体到具体的知识库条目。在这样的模式下NER系统的错误往往会传递到EL系统中,且EL系统缺乏足够的信息纠正错误。这种模式在长文本上可能合适,因为现有的实体识别系统在足够的训。练语料和足够理想的上下文情况下表现良好但当我们处理短文本的时候,送种模式下的NER系统对最终实体识别和链接的结果产生了不利影响。为了解决此类在短文本实体识别和链接任务上的错误传播问题,我们基于两个任务之间的親合关系及潜在可能的互促进效应,提出了2个联合处理NER和EL任一。务的模
8、型,分别是线性模型和基于半条件随机场的模型研巧者们般视NER为一NER和EL个序列标注问题,EL任务为实体排序问题。我们的线性模型视任务""为排序问题。它生成尽可能多的候选实体指称和实体对,选,并对其进行排序""择最合适的实体指称和实体对。我们基于半条件随机场的联合模型处理的是序""列标注问题,尽可,在标注其实体指称时能多的使用实体相关的特征
此文档下载收益归作者所有