欢迎来到天天文库
浏览记录
ID:36492937
大小:1.05 MB
页数:41页
时间:2019-05-11
《信息处理用藏语词类划分研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、’’9钉10S7分类号:H2论文编号:1074205010703093密级:内部西北民族大学研究生学位论文论文题目(汉文)焦基丝理用燕蚤逦娄型坌硒窒+论文题目(外文)R—esear—chonInformationProcessingbyTibetanWordsCategorization培养单位生国民蓝信息挂盔婴塞院学号P032210093研究生姓名盐酉加学科、专业童堂虫国坐塑垦送蚤直塞堂研究方向蘧塞。篮星申请学位亟±导师姓名、职称壬湛蠢煎攫论文工作起止年月2QQ§生Q垒屋至2QQ§生Q§旦论文提交B期2Q鳗生Q4旦论文答辩日期一垫Q曼.生!§目
2、学位授予日期校址:甘肃省兰州市西北新村1号信息处理用藏语词类划分研究摘要自然语言理解是语言信息处理的最高目标。计算机对自然语言的处理,首要确定语言系统的基本单位.如果最小的基本单位不确定。计算机将无法运算,既不能从小到大理解句子意思,也无法展开文本分类、自动分词、自动文摘、机器翻译、词类标注等一系列藏文信息处理技术所要解决的基础X-作。虽然我们有传统的词类划分方法,然而它是针对人的思维方式划分,没有考虑到与计算机的衔接。因此本文从传统语言学立场视角转向计算语言学,满足藏碚信息处理所用的词类划分需求,对所有的藏语词语进行归类,提出一套适应、实用、系
3、统的信息处理用藏语词类划分体系,它是计算机处理真实文本不可逾越的起点。本文以索绪尔的组合关系和聚合关系或陈望道先生所论的“配置”与“会同”的理论,美国描写语言学的分布分析,布龙菲尔德提出的形类等等作为理论依据,通过分析语言学界提出的三个分类标准,最终提出了语法功能标准为主,形态、意义标准为辅的分类方法.本文认为只有抓住了词的语法功能才能把握研究词类的实质,以及有效地探求和阐明词的句法成分能力、与别的词组合的语言规律等。本文以实例举证上述观点,以求作到以实用为面向,以理论为后盾,将藏文词jr划分为十四个大类、25个基本类、9个特殊类,力求为藏语语言
4、信息处理提供依据。关键词;藏语信息处理,词类,词类划分标准,词类体系。≮嘲叩啊蹶q禽蜀<却审可叩彳‘11气<南日1醑q鼍≈{细国珂1‘R气裔气
5、F闰N营蘑弋带俩日冷自<可气萝可q是N若<奄吓习1前葑黾qq氮N【
6、。舌可q专气’8N嘲萝马吓寄r目司Nf毪玎嚣气N专<‘弋马Nq彳骜弋末1q禽邓FS日1弋q禽自c专可萝茸气N气萝q气q萄<玎1i羽Nq恶≮唧邸营暂气N气萝日Iq彳簧弋耄弋黾N营暂气N气萝q’司百N自<’可气萝日禽舌弋习1耷习1鼍F1弋q可叮气N气g日Iq彳驾弋9弋黾N酉≈气N气9q’司百N5j<’叮气萝司耳击弋习1呵习1啊1弋q可叮气8气’气可爵县N司司1q彳骜彳豆彳氮N岔气》可专‘目司对f;辑。珂1田奄书目丁辱5肖<’ai邓宁净弋卞哥气<萝w习1事N1嘲Nq专习1N辱司寻<翻自
7、c可气萝可未气’葑q《q耳气<1雨<’习1译茸气吾q事≮冒书习1N习1翎田萝气萝可司亘≮q5Nq彳萄弋q霉FqN可蓍气q禽萄<唧书可铲申1刚帮q711弋嘲q彳可卞却啄呷q彳呐可q驴呷献唧衾羽萄<唧气萝q禽奄响献寸气萝q禽酊n呵西北民族大学硕士学位论文信息处理用藏语词类划分研究第一章、绪论在信息社会,语言即是与人交流的二r=具,也是与计算机交流的工具,当一种语言无法与计算机沟通,意味着它失去了大部分的交流能力,只能落伍于繁华的语言世界和信息社会里,因此,藏语信息处理是势在必行且是刻不容缓的紧要问题。“自然语言处理是研究在人与人交际中以及在人与计算机
8、交际中的语言问题的一门学科,自然语言处理要研制表示语言能力(1inguistccompetence)和语言应用(1ingu[stcperformance)的模型,建立计算机框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种使用系统,并探讨这些实用系统的测评技术”。⋯藏语自然语言处理也不例外丁上述自然语言处理的定义范畴。因此.藏语的自然语言处理必须要从基础的工作开始,而词类划分等问题是藏语信息处理中的核心问题,也是藏语信息处理遇到的基础问题,只有规范了信息处理用的藏语词类划分体系,才能解决自动分词、词性标
9、注、信息检索等更进一步的信息处理技术。已有的藏语词类划分体系无法覆盖信息处理用的藏语词类划分,因为二者的出发点不一样,这就要求我们在原有
此文档下载收益归作者所有