欢迎来到天天文库
浏览记录
ID:46603190
大小:409.55 KB
页数:7页
时间:2019-11-26
《基于HowNet的术语语义知识库构建技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、文章编号:2095-1248(2016)04-0078-07基于HowNet的术语语义知识库构建技术1211王羊羊,陈刚,蔡东风,王裴岩(1.沈阳航空航天大学人机智能研究中心,沈阳110136;2.中航昌河飞机工业(集团)有限责任公司科技部,江西景德镇333000)摘要:领域知识库能够满足特定领域的自然语言处理系统对知识的需求,然而大部分领域知识库的构建方式为手工构建,效率较低。针对这一问题,分析已经手工构建的2300余条航空术语描述信息及其在构建过程中总结的规则,在此基础上,总结了200余条核心词框架,核心词以外的其他词,通过一种规则与统计相结
2、合的方法进行框架的自动填充,从而提高了构建术语语义知识库的自动化程度。最后,对构建的术语描述信息进行了相似度计算,取得了较好的结果。关键词:术语;规则;统计;语义知识库中图分类号:TP391.1文献标志码:Adoi:10.3969/j.issn.2095-1248.2016.04.014ConstructiontechniquesofterminologysemanticknowledgebasebasedonHowNet1211WANGYang-yang,CHENGang,CAIDong-feng,WANGPei-yan(1.HumanMach
3、ineIntelligenceResearchCenter,ShenyangAerospaceUniversity,Shenyang110136,China;2.Sci-techDepartment,AVICChangheAircraftIndustry(Group)CompanyLtd,Jingdezhen333000,China)Abstract:Knowledgebaseforspecificdomainscansatisfytheknowledgerequirementsforthenaturallan-guageprocessingsy
4、stem.However,mostcurrentworkforbuildingthedomainknowledgebaseishand-builtandinefficient.Tosolvethisproblem,morethan2300piecesofterminologydescribinginformationandtherulesthathavebeenformulatedwereanalyzed.Thenmorethan200semanticframeworksweresumma-rizedbasedoncorewordwhilethe
5、otherwordsarefilledtotheframeworksaccordingtotheruleandthesta-tisticalresults.Finally,thevalidnessoftheconstructedknowledgebaseisdemonstratedthatgoodresultsareachievedintermofsimilaritycalculation.Keywords:terminology;rule;statistic;semanticknowledgebase[3]自然语言的语义分析和内容信息的理解离不
6、传统的语义知识库包括WordNet、[1][4-5]开语义知识库的支持,计算机可以通过语义知FrameNet在内,构建方式大多为手工构建;较[6][7-8]识库了解人类语言,从而变得更加智能。传统的大型的语义知识库只有MindNet和Yago语义知识库大多面向通用领域,不能满足特定领的构建方式为自动构建;此外,文献[9]提出了一[2]域的自然语言处理系统对问题的知识需求,所种基于实体-属性框架的领域知识库的自动构建以构建领域知识库是十分必要的。方法,然而它们都是以自然语言的形式进行表述,收稿日期:2015-12-11基金项目:国防基础科研项目(项
7、目编号:A0520131003);辽宁省高校创新团队支持计划(项目编号:LT2014005)作者简介:王羊羊(1991-),女,辽宁鞍山人,硕士研究生,主要研究方向:自然语言处理,E-mail:wangyangyang0408@126.com;蔡东风(1958-),男,河北霸县人,教授,主要研究方向:人工智能、自然语言处理,E-mail:caidf@vip.163.com。第4期王羊羊,等:基于HowNet的术语语义知识库构建技术79在计算机系统中不易对其进行相似度计算、相关面”:DEF={Height渣高度:host={waters渣水域}};
8、度计算等处理。“发动机”:DEF={part渣部件:PartPosition={heart文献[13]针对航空领域术语的特点,在渣心},
此文档下载收益归作者所有