现代汉语语义词典规范

现代汉语语义词典规范

ID:14807892

大小:225.50 KB

页数:12页

时间:2018-07-30

现代汉语语义词典规范_第1页
现代汉语语义词典规范_第2页
现代汉语语义词典规范_第3页
现代汉语语义词典规范_第4页
现代汉语语义词典规范_第5页
资源描述:

《现代汉语语义词典规范》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、现代汉语语义词典规格说明书-12-现代汉语语义词典规范本研究得到国家973重点基础研究项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)与“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”(项目号:G1998030507-1)的支持。王惠Email:whui@pku.edu.cn摘要:“现代汉语语义词典”(SKCC)是一部面向自然语言信息处理的语义知识库,它以数据库文件形式收录了6.6万余条汉语实词,不仅给出了每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的配价信息和多种语义组合限制,可以为包括机器翻

2、译在内的多种中文信息处理系统中的语义自动分析提供强有力的支持,同时,对于汉语词汇语义学和计算词典学研究也具有重要的意义。本文概要介绍这部语义词典的结构、内容,以及语义属性项目的填写规范。关键词:语义知识库语义类配价信息计算词典学中文信息处理TheSpecificationofTheSemanticKnowledge-baseofContemporaryChineseWangHui1,YuShiwen1,ZhanWeidong21(InstituteofComputationalLinguistics,PekingUniversity,Beijing100871,C

3、hina)2(Dept.ofChineseLanguage&Literature,PekingUniversity,Beijing100871,China)whui@pku.edu.cn;yusw@pku.edu.cn;zwd@pku.edu.cnAbstract:TheSemanticKnowledge-baseofContemporaryChinese(SKCC)isalargemachine-readabledictionarydevelopedbytheInstituteofComputationalLinguisticsandChineseDepartm

4、entofPekingUniversity.Itcanprovidealargeamountofsemanticinformationsuchassemantichierarchyandcollocationfeaturesof66,539Chinesewords.ItssemanticclassificationsystemrepresentsthelatestprogressinChineselinguisticsandlanguageengineering.Thedescriptionsofsemanticattributesarefairlythoroug

5、h,comprehensiveandauthoritative.ThepaperintroducestheoutlineandspecificationofSKCC,andindicatesthat,asalargescalefundamentalsemanticresourceofChinese,SKCCwillnotonlyprovidevaluablesemanticknowledgeforChineselanguageprocessing,butalsoplayanimportantroleinChineselexicalsemanticsandcompu

6、tationallexicographyresearch. Keywords:Semanticknowledge-base,lexicalsemantic,computationallexicography,semantichierarchy,valenceinformation,Chineselanguageprocessing12现代汉语语义词典规格说明书-12-1引言在自然语言处理中,语义分析占有很重要的位置。北京大学计算语言学研究所与中科院计算所自1994年联合开发“汉英机器翻译模型系统”开始,就着手研制面向汉英机器翻译的“现代汉语语义词典”(SKCC),

7、目的是在语法分析的基础上,为计算机自动分析汉语句子和生成英语句子提供更深入的语义信息。1996年至1998年,双方共同承担了国家863高科技项目“通用机器翻译开发平台和汉英机器翻译系统”课题(项目编号:863-306-03-06-2)。作为该课题的一个重要组成部分,“现代汉语语义词典”进入到大规模开发阶段,并取得阶段性成果,完成了4.9万汉语常用实词(名词、动词、形容词)及部分成语、习用语的语义分类和搭配信息描述[1]。IBM、Intel、Fujitsu,Toshiba,NTT,Canon,Sail-labs等20多家公司与大学先后从北大购买了该词典的许可使用权。

8、4年多来,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。