《机器翻译用现代藏语语义词典》的设计研究

《机器翻译用现代藏语语义词典》的设计研究

ID:14263895

大小:41.50 KB

页数:11页

时间:2018-07-27

《机器翻译用现代藏语语义词典》的设计研究_第1页
《机器翻译用现代藏语语义词典》的设计研究_第2页
《机器翻译用现代藏语语义词典》的设计研究_第3页
《机器翻译用现代藏语语义词典》的设计研究_第4页
《机器翻译用现代藏语语义词典》的设计研究_第5页
资源描述:

《《机器翻译用现代藏语语义词典》的设计研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《机器翻译用现代藏语语义词典》的设计研究第25卷总第54期2004年9月西北民族大学(自然科学版)JournalofNorthwestUniversityforNationalities(NaturalScience)V01.25.No.3Sep,2004《机器翻译用现代藏语语义词典》的设计研究祁坤钰(西北民族大学中国民族信息技术研究院,甘肃兰州730030)【摘要]文章就现代藏语语义词典设计的理论框架,语义分类思想,语义分类体系和属性描述原则.构造了一个初步适应英藏机器翻译的藏语语义分类体系.指出了语义分类和语义属性描述在语义分析中的重要性.阐明了语义分类与语义属性描述两者之间

2、的约束关系,探讨相关的语义分析研究课题.【关键词】机器翻译;藏语语义词典;藏语语义【中图分类号]TP312【文献标识码]A【文章编号]1009—2102(2004)03—0033—05汉语的信息处理已经从字,词处理向语义处理方向过渡,而藏语语言处理一直停留在字,词处理阶段.虽然西北民族大学,青海师大,西藏大学,西南民族大学等几所高校开设了相关学科专业,研究开发相关科研项目,但由于基础研究,人才,设施等诸多因素,藏文信息处理研究及其产品开发的进度相对缓慢.这对现代高速发展的藏族社会及其文化教育状况很不适应.因此,针对藏文信息处理领域的实际情况,应大力加强藏语句法知识,语义知识,语用

3、知识的基础理论研究,这些基础研究的课题都是语言信息处理领域高难度的前沿课题,已被国内外有关专家关注.其中,句法知识,语义知识的获取是当前的重点.语义知识是二者的难点,而建立一套比较完善的基于词的语义信息词典将是藏语语义分析研究的突破口.1词典的理论来源藏族文化由于受古印度逻辑哲学思想的影响,传统文化体系相对完整.从公元8世纪开始,在1000多年的历史长河中,形成了涵盖文学,哲学,宗教,天文历算,艺术,语言等学科的"十明"文化体系.其中以"三十松"和"音势论"为核心的藏语逻辑格语法理论体系必然是藏语自然语言处理研究的重要基础理论之一.藏语是属于格语法理论体系的拼音文字,其语格有八种

4、形式,每一个格关系都有一个格助词作为形式标记描述一个最短的语义,一个句子至少要有一个格来描述.除"目的格"外,其他的语"格"应属于形式逻辑格,这与语言学家菲尔莫提出的格语法有本质的区别,前者是形式逻辑格,后者是语义逻辑格.我们知道自然语言处理的关键就是要找到处理真实文本所需要的形式化,规则化的理论和方法,语言深层结构和表层结构的转换,形式逻辑格与语义格的结构映射都是语言形式化描述的具体途径.藏语在两种结构映射方面有着天然的优势,其特点主要表现在:[收稿日期]2004—06—26[基金项目]"信息处理用藏文分词研究"得到国家社会科学基金资助,项目编号[02BYY038]【作者简介]

5、祁坤钰(1968一),男(土族),甘肃天祝人,讲师,主要从事藏语计算机语言学.1)传统的藏语语法包含八种语格,除了第一个格"本性格"以外,其他七个语格均与述语属性及动词配价有直接关系.2)除第一个格外,每一个语格都有一个格助词做形式标记.3)动词的配价数目确定逻辑格边界.如果是一价动词,则单句不包含实施格和受事格,并且一价动词有不及物性(藏语语法称无客性);如果是二价动词,则单句原则上包含实施格和受事格,但可以隐含,并且二价动词有及物性.如果是三价动词;则单句一定包含实施格,也有可能包含受事格,对象格,来源格等.4)动词的时态同句子的时态,语态在语义上有联系.5)同一组字母为基字

6、的部分词在语义上有某种特定的联系.6)格助词不但表达形式逻辑格,而且可以表述部分语义格,这种现象在其他民族语言中很少存在,可以进一步研究藏语形式逻辑格和语义格的映射关系.7)动词的前,后,上,下加字对动词的名物化有制约作用.藏语语法中存在的这些现象和规律,将为藏语语言处理研究提供有效的理论依据,我们在着力研究藏语语言的同时,还应该面向国内自然语言处理研究的前沿领域,掌握其他民族语言尤其是汉语,英语语言处理的相关词法,语法,语义分析等方面的理论和方法.在语义分析方面,国内外有诸多语义分析理论,如:有格语法,题元理论,配价语法,蒙塔格语法,HNC概念层次网络等,经过对比分析研究,我们

7、吸收了格语法,配价语法,HNC概念层次网络等语法的思想,依据藏语语法理论的特点,选择了与藏语形式逻辑格理论最接近的配价理论,对藏语动词的配价关系做了详细的描述,根据概念层次网络的联想脉络,把藏语词的义项从属性,上下位关系,语义作用效应等方面做了描述,形成了一个比较合理的藏语语义网络.同时,根据藏语特殊性,我们提出了语法与语义分析并重的思想,分析系统框架由语法分析和语义分析构成,语法分析在前,语义分析在后,用语义信息来限制,消除多义词的义项,使得系统得到正确的句法结构,最终为英藏机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。