资源描述:
《英语学习词典机辅编写系统的设计原则与实现_陈国华》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第117期外语电化教学No.1172007年10月CAFLEOct.2007*版权所有文责自负*语言技术与外语教学研究英语学习词典机辅编写系统的设计原则与实现陈国华,熊文新(北京外国语大学中国外语教育研究中心,北京100089)摘要:词典编纂过程中的质量控制是决定一部词典开发成功与否的重要环节。英语学习词典机辅编写系统借助计算机有助于将不同编辑过程、不同编写和校对人员可能存在的格式不一致情况减少到最低程度。我们在本文中介绍了英语学习词典机辅编写系统的设计原则以及一个原型系统的实现。关键词:机辅词典编写系统;学习词典;词典编纂;
2、设计原则中图分类号:H319.3文献标识码:A文章编号:1001-5795(2007)10-0003-0005词典一般篇幅较大,词条少则几万、多则十几万、词典及引文词典或百科全书等的词典生成系统,试图几十万,总字数常以百万、千万计。词典从设计、编写使词典编写和生成更方便有效(McNamara,2003)。到出版是一个需要多方协作、费时经年的浩大工程。美国SIL研制出LexiquePro,为语言田野调查服务。参编人员众多,流程复杂,项目管理控制困难;不同编这是一个交互式词汇浏览编辑器,通过某一词目能够者的语言风格差异,各个编写阶
3、段编辑体例的变迁也链接其他相关词目,并实现词目按类别浏览,词目与释使得词典质量控制越发棘手。为了解决这一问题,西词的相互查询。捷克Masaryk大学实现了一个词典编方发达国家出版界已经普遍利用计算机进行词典辅助写及浏览器(Palaeta,l2006:199-204)。南非Tsh-编写工作。在我国,词典学家仍缺少得力的计算机辅waneDJe公司开发的词典编辑应用软件TshwaneLex助词典编写(简称/机辅词编0)软件,从而造成词典编(deSchryvereta,l2006:41-46),能够展现词典编写写周期长、再版率低。机辅
4、词编系统的研发已经成为的中间结果预览、定制词典呈现风格、交叉参照追踪所我国词典学发展的必由之路和出版界一件迫在眉睫的有词目及进行词目的自动词形还原等,并支持纸版、电任务。我们不久前完成的教育部人文社科重点研究基子版和在线版等介质。日本Papillon项目(Thevenin,地重大项目/基于英汉平行语料库的英语学习者词典2002:8)为创建多国语言词汇数据库,实现了一个可以的研编0课题就是为此目的而开展的。通过Web、手机和Dictd协议访问的开源词典编辑系统。在国外,网络条件比较成熟,大型词典出版商有稳1国内外研究现状定的编纂
5、队伍,他们充分利用服务器的强大计算和存自2002年以来,欧洲词典学会连续召开了四届关储功能,对词典编纂实施实时监控与管理,这是国外此于计算机词典编写系统的国际专题会议。近几年也涌类系统的特点。现出越来越多的各类机辅词编系统。我国的词典学研究机构和出版社已经意识到一个法国IDM公司开发了一个用于单双语词典、义类良好的机辅词编系统对于提高词典编写的效率和质量作者简介:陈国华:男,博士,教授。研究方向:语言学、英汉对比与翻译、双语词典学。熊文新:男,博士,工程师。研究方向:应用语言学、计算语言学。收稿日期:2007-06-05基金项
6、目:本文为教育部人文社会科学重点研究基地重大项目/基于英汉平行语料库的英语学习者词典研编0(02JAZJD740005)成果之一。#3#陈国华,等:英语学习词典机辅编写系统的设计原则与实现有着重要意义,但计算机应用目前多数仍集中在电子整和词典再版修订时体例的变化,机辅词编系统应能词典的制作以及语料库例句检索。当前仅有南京大学方便、及时地统一依据新要求更新体例、版式,而无需双语词典研究中心、广东外语外贸大学辞典学研究中重新更改已经编好的词目信息的语言内容,即在词典心在进行计算机辅助纸版词典编写的尝试(刘辉,章编写过程中,应做到词
7、典信息内容和词典形式的脱离。宜华2005:121-124),但所研发的系统未对外公开。2.2系统设计由国外商业软件公司开发的机辅词编系统多数把一部词典应该翔实地描写词汇的形、音、义、用。词典编纂视作信息管理项目,求大求全,缺乏针对性,计算机辅助词典学(ComputerAssistedLexicography)需要想在一个具体的词典项目中应用,需要进行大量的要分别在这四个方面为词典学提供辅助服务。在定制化(customized)工作。在我国,词典项目组人员通/形0上,要解决词的自动识别问题;在/音0上,要解决常比较分散,网络条件
8、不尽如人意,用户联网成本昂词的自动注音、发音乃至例句的发声问题;在/义0上,贵,在线时间不能保证,因此照搬国外此类系统不太现要部分解决词的语义特征标注问题,在/用0上,要解实。我们借鉴国际比较成熟的类似系统,结合计算机决词的用法(主要是其语法和词汇搭配)以及从语料程序实现技术