外向型汉语词典用词用字探析

外向型汉语词典用词用字探析

ID:8083756

大小:428.60 KB

页数:7页

时间:2018-03-05

外向型汉语词典用词用字探析_第1页
外向型汉语词典用词用字探析_第2页
外向型汉语词典用词用字探析_第3页
外向型汉语词典用词用字探析_第4页
外向型汉语词典用词用字探析_第5页
资源描述:

《外向型汉语词典用词用字探析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2011年第1期华文教学与研究总第41期N0.12011TCSoLStudiesSumNo.41外向型汉语词典用词用字探析张静静,赵新(1.2.中山大学国际汉语学院,广东,广州510275)[关键词]外向型汉语词典;用词用字;控制[摘要]本文对近期编写的《实用汉语近义虚词词典》的用词用字进行了考察,以此为主要依据,提出了一整套具体可操作的统计、控制外向型词典用词用字的方法和步骤;并对控制的结果进行了分析和思考,提出了对用词用字数量和范围的看法。[中图分类号]H061[文献标识码]A[文章编号]1674—8174(2010)Ol一0052

2、—07降低词典语言的难度,使二语学习者容易理解,是外向型汉语词典需要解决的重要问题之一,而控制词典用词用字的数量和范围(即等级),则是降低词典语言难度最重要、最有效的途径。目前国内尚未开发出能够对词典用词用字进行自动控制的专用软件,也尚未有人对汉语词典用词用字控制的手段与方法进行具体可行的研究。我们在编写外向型汉语词典《实用汉语近义虚词词典》(即将由北京大学出版社出版,下称《近义虚词》)的过程中,对用词用字的控制反复进行了思考,尝试将人工手段与科技手段相结合,进行控制。本文以这部词典为基础,说明词典用词用字控制的具体过程、手段和方法。一

3、般来说,词典的用词用字分为两个部分:解释词语意义、说明用法的是释义部分,这部分的用词用字称为释义用词用字;举例说明词语意义和用法的是例句部分,这部分的用词用字称为例句用词用字。这两部分用词用字控制的过程、方法和手段大致相同,因此一并进行讨论。由于用词控制是关键,是用字控制的基础,在这里先讨论用词的控制。1.用词的统计用词的统计是对用词进行考察和控制的基础,是第一步的工作。通过统计了解释义用词的使用数量、使用范围、使用频率等具体情况,才能有针对性地进行控制,同时也有利于确定用词的数量与范围。用词的统计有3个步骤:制作电子文本;计算机分词、

4、统计;人工干预。1.1制作电子文本制作电子文本分为3步:首先,在编写好的词典电子稿中将释义部分与例句部分分开(释义部分中须删除词目、拼音、词性、例句、英文字母或符号、释义中出现的被释词等),制作成两个电子文本:释义电子文本和例句电子文本;其次,对输入的电子文本进行校对,以减少疏漏,保证文本的准确性;最后将电子文本保存为.doc和.txt两种格式,以备随时调用。同时,为了处理、统计的方便,将电子文本按照《近义虚词》的收词音序切分成4份.doc文件。1.2计算机分词、统计我们使用的分词和统计软件是北京语言大学出版社出版的“中文助教”(Chi

5、neseTA)。该软件是针对中文教师编写教材和日常备课实际需要开发的一个现代化工具软件,具有较强的分词和字词处理能力,为用词的统计提供了极大的便利。软件分词依据国家汉办汉语水平考试部1992年编制的《汉语水平词汇与汉字等级大纲》(下称《等级大纲》),将所分词标注甲乙丙丁四个等级,不在其内[收稿日期]2009—12—11[作者简介]张静静(1981一),女,山东烟台人,中山大学国际汉语学院讲师,博士,研究方向为对外汉语教学。赵新(1951~),女,河南人,中山大学国际汉语学院教授,研究方向为近代汉语及对外汉语教学。52张静静,赵新:外向型

6、汉语词典用词用字探析的为超纲词。导人文本,“中文助教”软件对文本自动进行一系列的处理,得出按等级排列的释义用词表和例句用词表,并标明每个词的出现频率。这是释义用词、例句用词的原始情况。1.3人工干预人工干预是用词统计中必不可少的一个环节。“中文助教”自带的分词系统能够正确切分出大部分词语,但也存在一些问题,对机器分词的结果进行人工干预,是保证统计结果真实、准确、合理的必要措施。人工干预主要包括两个内容:识别同形词;识别超纲词。1.3.1识别同形词汉语有些词有几种词性和用法,机器分词不能分化同形词,只能标注出该词在《等级大纲》中的全部词性

7、,中文助教软件分出的用词中,有些就标注几种词性和等级,需要根据释义原文和例句原文来分化同形词,确定到底是一个词还是几个词。如:好:①形(甲级);②副(甲级);③动(ha0乙级);④连(丙级)释义部分中,“好”使用17次,利用电脑的“查找”功能在原文中查找每次的使用情况,确定其究竟是几个词,经过一一查找核对,“好”是1个词:形容词(甲级),然后在释义用词甲级词表中计入1个“好”(形容词)。释义用词中共有这样的同形词49个:“当、好、就、行、重、倒、别、才、长、成、要、难、光、假、量、应、传、挑、地方、结果、处理”等,经过人工识别,49个同

8、形词实际上是57个词语,需要在释义用词总数上加8个,并将分化出的词分别计入不同等级的词表。例句用词中共有同形词79个,由于人力限制,未加识别。1.3.2识别超纲词机器分词出现的问题主要集中在超纲词,因此需要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。