欢迎来到天天文库
浏览记录
ID:32358405
大小:1.05 MB
页数:12页
时间:2019-02-03
《代汉语语义词多义词词的校和修-associationforcomputational》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、The2015ConferenceonComputationalLinguisticsandSpeechProcessingROCLING2015,pp.206-217TheAssociationforComputationalLinguisticsandChineseLanguageProcessing.代汉语语义词℠多义词词⸻的校㬋和ℵ修孊摘要 本文依据面向汉语信息处理的词语义 区分的 完备性 和 操作性 原则,基于 代汉语语义词 炷SKCC 和 代汉语语法信息词 炷GKB炸的词 对 ,以语料 依托并结合 代汉
2、语词 ˣ 义词词林 和 代汉语搭配词词 等词 资源进行 代汉语语义词 的多义词词 校 工作ˤ首先 SKCC和GKB的词 对 入手,设 了候选拟修改多义词的 取算法,对 取出来的1605个多义词进行了义 补录 合并 删除,补充释义,修改翻译和示例等工作, 时针对 类特殊的 食物+作物类 多义词建立了义 的树形结构以满足 粒度的词义消歧任 要求ˤ 方便 续的修改工作,本文开发了SKCC和GKB之间的词 映射 ,在 的基础 进行了多义词映射工作 关键词 义 区分 代汉语语义词 多义词映射 多义词修改Newediting
3、andcheckingworkoftheSemanticKnowledgebaseofContemporaryChinese(SKCC)Abstract:ThispaperisrootedinthetwoprinciplesandmethodsthatshouldbefollowedbysensediscriminationforChineselanguageprocessing:Completenessanddiscreteness.BuiltonthecomparisonofSemanticKnowledge-baseofCo
4、ntemporaryChinese(SKCC)andGrammaticalKnowledgebaseofContemporaryChinese(GKB),supportedbylargescalecorpus,weconductedourneweditingandcheckingworks.Firstly,wedesignedanovelmulti-senselexiconcandidateabstractionalgorithmbasedonlexiconcomparisonbetweenSKCCandGKB.Forall160
5、5candidatemulti-senselexicon,weconductededitingworkonthesenses,explanation,anditstranslationˤThen,webuiltatreestructuretoprocessaspecialfoodandplantlexicon.Thirdly,amappingplatformbetweenSKCCandGKBhasbeenbuilttohelpusbuiltmappingrelationshipsbetweenmulti-senselexicalb
6、etweenSKCCandGKB.Finally,wefinishedmappingworkforallmulti-senselexiconinSKCC.Keywords:Distinguishwordsense;SKCC;Multi-sensewordmapping;Multi-sensewordeditingᶨ、引言 代汉语语义词 炷SemanticKnowledge-baseofContemporaryChinese,以 简称SKCC炸是 个面向汉英机器翻译的大规模汉语语义知识 ,目的是在语法分析的基础ᶲ,给自然语言处理
7、㍸供更≈全面ˣ深入的语义信息ˤ[1]作 ⚥家科技进㬍Ḵ等奖获得校目“综合型语言知识⸻炷ComprehensiveLanguage206KnowledgeBase,以 简称 CLKB炸”的 部分,SKCC被广泛 用于 算词汇语义学的基础研究和 用研究之中,例如魏雪 袁 林 2014 以SKCCᷢ依托建立了 词语义类组合模式[2],张仰森炷2012炸利用SKCC进行了词汇语义相似度的孉算[3]等 来孉算词汇学特别是词义划分理论领域取得了较大的进展,吴云芳ˣ 士汶炷2006炸 出了 实际操作性的面向汉语信息处理的词语义 区分原则和
8、方法[4],而SKCC自2003 第 版发布以来 直没 进行大规模更 因 , 必要结合自SKCC发布以来语义词 编纂和词义划分理论的 果,对SKCC的多义词词 进行修 ,使 更好地 自然语言处理服≉ˤ本文首先建立了SKCC和GKB的多义词映射⸛
此文档下载收益归作者所有