代汉语语义词多义词词的校和修-associationforcomputational

代汉语语义词多义词词的校和修-associationforcomputational

ID:32358405

大小:1.05 MB

页数:12页

时间:2019-02-03

代汉语语义词多义词词的校和修-associationforcomputational_第1页
代汉语语义词多义词词的校和修-associationforcomputational_第2页
代汉语语义词多义词词的校和修-associationforcomputational_第3页
代汉语语义词多义词词的校和修-associationforcomputational_第4页
代汉语语义词多义词词的校和修-associationforcomputational_第5页
资源描述:

《代汉语语义词多义词词的校和修-associationforcomputational》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、The2015ConferenceonComputationalLinguisticsandSpeechProcessingROCLING2015,pp.206-217TheAssociationforComputationalLinguisticsandChineseLanguageProcessing.代汉语语义词℠多义词词⸻的校㬋和ℵ修孊摘要本文依据面向汉语信息处理的词语义区分的完备性和操作性原则,基于代汉语语义词炷SKCC和代汉语语法信息词炷GKB炸的词对,以语料依托并结合代汉

2、语词ˣ义词词林和代汉语搭配词词等词资源进行代汉语语义词的多义词词校工作ˤ首先SKCC和GKB的词对入手,设了候选拟修改多义词的取算法,对取出来的1605个多义词进行了义补录合并删除,补充释义,修改翻译和示例等工作,时针对类特殊的食物+作物类多义词建立了义的树形结构以满足粒度的词义消歧任要求ˤ方便续的修改工作,本文开发了SKCC和GKB之间的词映射,在的基础进行了多义词映射工作关键词义区分代汉语语义词多义词映射多义词修改Newediting

3、andcheckingworkoftheSemanticKnowledgebaseofContemporaryChinese(SKCC)Abstract:ThispaperisrootedinthetwoprinciplesandmethodsthatshouldbefollowedbysensediscriminationforChineselanguageprocessing:Completenessanddiscreteness.BuiltonthecomparisonofSemanticKnowledge-baseofCo

4、ntemporaryChinese(SKCC)andGrammaticalKnowledgebaseofContemporaryChinese(GKB),supportedbylargescalecorpus,weconductedourneweditingandcheckingworks.Firstly,wedesignedanovelmulti-senselexiconcandidateabstractionalgorithmbasedonlexiconcomparisonbetweenSKCCandGKB.Forall160

5、5candidatemulti-senselexicon,weconductededitingworkonthesenses,explanation,anditstranslationˤThen,webuiltatreestructuretoprocessaspecialfoodandplantlexicon.Thirdly,amappingplatformbetweenSKCCandGKBhasbeenbuilttohelpusbuiltmappingrelationshipsbetweenmulti-senselexicalb

6、etweenSKCCandGKB.Finally,wefinishedmappingworkforallmulti-senselexiconinSKCC.Keywords:Distinguishwordsense;SKCC;Multi-sensewordmapping;Multi-sensewordeditingᶨ、引言代汉语语义词炷SemanticKnowledge-baseofContemporaryChinese,以简称SKCC炸是个面向汉英机器翻译的大规模汉语语义知识,目的是在语法分析的基础ᶲ,给自然语言处理

7、㍸供更≈全面ˣ深入的语义信息ˤ[1]作⚥家科技进㬍Ḵ等奖获得校目“综合型语言知识⸻炷ComprehensiveLanguage206KnowledgeBase,以简称CLKB炸”的部分,SKCC被广泛用于算词汇语义学的基础研究和用研究之中,例如魏雪袁林2014以SKCCᷢ依托建立了词语义类组合模式[2],张仰森炷2012炸利用SKCC进行了词汇语义相似度的孉算[3]等来孉算词汇学特别是词义划分理论领域取得了较大的进展,吴云芳ˣ士汶炷2006炸出了实际操作性的面向汉语信息处理的词语义区分原则和

8、方法[4],而SKCC自2003第版发布以来直没进行大规模更因,必要结合自SKCC发布以来语义词编纂和词义划分理论的果,对SKCC的多义词词进行修,使更好地自然语言处理服≉ˤ本文首先建立了SKCC和GKB的多义词映射⸛

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。