一种用于专利实体的实体消歧方法.pdf

一种用于专利实体的实体消歧方法.pdf

ID:52055974

大小:399.62 KB

页数:7页

时间:2020-03-22

一种用于专利实体的实体消歧方法.pdf_第1页
一种用于专利实体的实体消歧方法.pdf_第2页
一种用于专利实体的实体消歧方法.pdf_第3页
一种用于专利实体的实体消歧方法.pdf_第4页
一种用于专利实体的实体消歧方法.pdf_第5页
资源描述:

《一种用于专利实体的实体消歧方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第32卷第1期2015年2月沈阳航空航天大学学报JoumalofShenyangAerospaceUniVersi够V-01.32No.1Feb.2O15文章编号:2095—1248(2叭5)01—0077—07一种用于专利实体的实体消歧方法王琰炎,王裴岩,蔡东风(沈阳航空航天大学知识工程与人机交互研究中心,沈阳110136)摘要:将实体搜索技术应用于中文专利摘要文本,并在实体搜索过程中使用了实体消歧技术,得到用户最关注的实体相关信息。在充分分析了专利摘要文本的特点的基础上,提出一种面向专利实体的消歧方法。使用基于IPc和向量空间模型的词向量表示法,结合凝聚式层次聚类算法,得到专利

2、实体消歧结果。根据对比实验的结果能够得出结论,本方法能够实现准确的实体消歧,评测结果高达78.9%。关键词:专利实体;实体搜索;实体消歧;mc;凝聚式层次聚类中图分类号:TP391.1文献标志码:Adoi:10.3969/i.issn.2095—1248.2015.01.013AnentitydisambiguationmethodforpatententityWANGYan-yan,WANGPei—yan,CAIDong—feng(KnowledgeEngineemgResearchCenter,shenyangAerospaceu11iversity,Shenyang11013

3、6,China)Abstract:Weapplyentitysearchtechn0109ytot11eabstracttextofChinesepatent,a11dmal【euseofthetechnologyofentitydisambiguation,obtainingmerelatedinfonnationmatusersareconcemedaboutmost.Thispaperproposesadis锄biguationmetllodbasedonmeadequateanalysisoftllefeaturesofmeabstracttextofpatent.Comb

4、inedwimHAC,thepaperhasgottentheresultofdisambiguationbyusingthewordVectorrepresentationonthebasisofIPCaIldVectorSpaceModel.Theparallelexpe血nents1eadtotheconclusionthatmemethodcoulddisambiguateaccuratelywimthemeasureValueof78.9DerCent.Keywords:patententity;entit),search;entitydis锄biguation;IPC;

5、HAC专利文本是集技术情报、法律情报和经济情报于一体的实用知识载体,是极为重要的科技信息来源‘1

6、。专利实体作为专利文本中的核心对象,研究价值较高。专利实体的消歧是专利实体搜索的核心步骤,目标是解决专利实体搜索中同名实体的歧义问题,帮助用户准确定位目标信息。在专利文本的基础上进行实体消歧,就是将具有领域歧义的实体相关词按照不同的领域含义划分为不同的类别。因此,专利实体上的歧义消解实际上就是目标词的聚类收稿日期:2叭4—10—24基金项目:国家自然科学基金(项目编号:2012BAHl4Foo)作者简介:王琰炎(1990一),男,辽宁鞍山人,硕士研究生,主要研究方向:人工智能与自然语言

7、处理,E—mail:f母an.yaIl@163com;王裴岩(1983一),男,辽宁沈阳人,博士研究生,讲师,主要研究方向:人工智能与自然语言处理,E—mailW83P27Y09@163.com。78沈阳航空航天大学学报第32卷过程,消歧结果的好坏就取决于聚类中目标词向量的原始特征选择。本文尝试了三种不同的特征选取方法,将目标词表示成特征向量,再进行类别划分。经过实验验证,使用基于IPc分类的特征生成目标词向量的方法取得了更好的效果。本文共分为5部分内容,第1部分介绍了国内外的相关研究,第2部分介绍了本文提出的三种相关词特征向量表示方法,第3部分介绍了使用聚类算法进行专利实体消歧的

8、过程,第4部分则是实验和分析,最后一部分是本文得出的结论与展望。1相关研究实体消歧问题是当下比较热点的研究问题,国内外的大多熟研究从两个角度解决实体歧义造成的影响,分别是通过寻求更高质量的特征和引入外部资源辅助消解。在特征选取方面,何正焱旧1利用DNN(深度神经网络)方法,提出了一种文档和实体的相似度为框架的消歧模型;姜丽丽旧。提出了一种基于带权图结构的框架来实现人物实体的消歧工作,并使用实体标签对每个人物实体进行标注;Bagga和BaldwinMl将不同文档问上下文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。