面向自然语言信息处理的维吾尔语名词形态分析研究

面向自然语言信息处理的维吾尔语名词形态分析研究

ID:16070963

大小:37.53 KB

页数:9页

时间:2018-08-07

面向自然语言信息处理的维吾尔语名词形态分析研究_第1页
面向自然语言信息处理的维吾尔语名词形态分析研究_第2页
面向自然语言信息处理的维吾尔语名词形态分析研究_第3页
面向自然语言信息处理的维吾尔语名词形态分析研究_第4页
面向自然语言信息处理的维吾尔语名词形态分析研究_第5页
资源描述:

《面向自然语言信息处理的维吾尔语名词形态分析研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、面向自然语言信息处理的维吾尔语名词形态分析研究面向自然语言信息处理的维吾尔语名词形态分析研究2010-11-09面向自然语言信息处理的维吾尔语名词形态分析研究阿依克孜.卡德尔'开沙尔.卡德尔'吐尔根.依布拉音',新强大学。人文学院,乌咨木齐胜利路14号830046);,新强大学,信息科学与工程学院,乌鲁木齐胜利路14号830046)E-mail:aytizkadir@163.com摘要本文对维吾尔语名词的形态变化名词的数、人称、格等语法范畴进行了形式化的描述和分析,指出了维吾尔语名词的苏本形态参数并总结了参数的组配规律

2、,统计了及其类型,为维吾尔语信.息处理中的名词形态处理提供了有益的方法和思路.关键词维吾尔语信息处理;名词;形态引言维吾尔语是一种形态发达的粘着语,各词类一般都具有一定的语法范畴,主要表现形式是形态变化。也就是说每一个词在生语料中以不同的形态出现,这主要表现为词干上按照一定的循序缀接不同的词尾。举名词"til"(语言为例恤ilmilletnigmuhimalahidiliklirinit]biri.(语言是民族的重要特征之一。OOu川Xiltildarawansezl承坷du.(他能用三种语言流利地交流.)以上例句①中

3、"til"以原形单数、主格形式出现,表示"til"是逻辑和语法主体例句②中"til"以原形附加词尾"da"的形式出现,其中"da"是时位格词尾,这里表示动作的工具。因此在维吾尔语信息处理中,形态分析问题,尤其是名词、动词等基本实词的形态分析是一个很重要的问题。着眼于这一问题,在此我们首先将分析维吾尔语名词语法范畴这里指的是形态范畴及其形态变化规律。1维吾尔语名词形态分析的必要性在所有的语言中,名词是最基本的实词之一,再说维吾尔语名词的形态变化非常丰富。很有必要仔细分析,深入研究。1.1从第一语言习得的角度看第一语言习得

4、的研究表明,在儿童早期的习得过程中,首先习得的基本单位是一些未经形态变化的单词,然后慢慢再习得语言能力中的语法规则。因此一个两岁大的小孩会说:"apakeldi(妈妈来了。)',"men时ketimen(我要回家。)"这样的形态变化不完整的句子。实际上,上述例句中的"apa(妈妈)"应该发生形态变化,词干上应该缀接人称词尾"m".表示说话者的妈妈。"0i(家)"的词干上应该缀接向格词尾"ge",表示行为的趋向。这说明了人的语言知识中,尤其是形态丰富的维吾尔语语言知识中,名词的形态问题也占据相当重要的地位。1.2从第二语

5、言习得的角度看如果说名词的形态对于操维吾尔语者的问题主要限于书面语范围的话,那么它对于第二语言学习者来说。问题就会普遍得多、严重得多。对操母语者来说十分简单的形态变化,哪怕是三岁孩子也不会发生错误,但却经常使第二语言学习者,尤其是那些母语是缺乏形态变化的分析性语言的第二语言学习者错误百出。第二语言学习者往往根据自己母语的语法规则,按照词对词翻译的方式造出目标语中的组合形式,而这些组合形式往往在目标语中是不符合语法规则的.比如汉语的:"明天乌鲁木齐晴,有时多云",在维吾尔语中应该用"eteyrymtfidehawaof和

6、q"bezidebulutluqbolidu"表达。其中"yrymtfide"是名词"乌鲁木齐"的时位格形式,表示处所,在这里可不能用名词原形"yrymtfi可见对于第二语言学习者来说,习得形态丰富的维吾尔语时必须重视名词的形态。1.3从自然语言处理的角度看1.3.1自然语言理解自然语言理解是知识信息中的核心问题。由于维吾尔语是典型的粘着语,名词的形态由不同的词尾的不同的组配构成,所以名词的形态分析是维吾尔语言理解中的难点之一。如果总结出维吾尔语名词的形态规则,井统计出名词词尾的组配类型,就有助于理解同一名词的不同形式

7、并把它们归结为原形上。比如.可以弄清"kitaptin(从书上,kitapni(把书,kitaplar(一些书)"都是"kitap(书)"一词的不同形态,只不过附加意义上有所区别。1.3.2语言生成总结出维吾尔语名词的形态规则,并统计出名词词尾的组配类型之后,按照词尾的组配及其缀接规则,可以生成同一名词的不同形式,使用于语句的准确输出。比如,按照规则级接词尾,从"可房子、家)"一词一般最多可以生成120多种可使用的形式见以下维吾尔语名词形态参数组配例表1.3.3机器翻译名词的形态分析,对机器翻译非常重要,因为机译系统的

8、核心是分析、转换和生成.只要仔细分析维吾尔语各词类的形态规则,才能解决目标语言和原语言之间的形态转换问题,其中名词是首先要处理好的词类之一。2维吾尔语名词的语法范畴维吾尔语的名词有数、人称、格等语法范畴.由于这里的研究是面向计算机的,形式化的描述当然是必要的10,所以下面我们将对维吾尔语名词的数、人称、格等语法范畴尽可能地进行形式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。