欢迎来到天天文库
浏览记录
ID:34146540
大小:7.26 MB
页数:54页
时间:2019-03-03
《多种蒙古文编码自动识别方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391UDC论文题目密级编号1012¨1109017研究生:奎值指导教师:孟塑直雅副数拯专业:让簋扭型堂皇撞苤研究方向:墓直塞焦:基处理所在学院:让簋扭堂院2014年5月2日原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得凼塞直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:垒玉刍指导教师签名:Et期:垫i竺墨:垄日期:在学期间研究成果使用承
2、诺书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果(含计算机软件、程序)属于内蒙古大学计算机学院。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学计算机学院就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学计算机学院方可投稿或公开发表。学位论文作者签名:查l鱼指导教师签名:日、期:竺!兰』:圣Et期:
3、内蒙古大学硕士学位论文多种蒙古文编码自动识别方法的研究摘要随着计算机技术和网络技术的飞速发展,蒙古文信息处理的工作也取得了很大的进步。但是由于蒙古文国际标准编码出台的相对滞后,目前市场上各种软件厂商采取自己的编码标准,使得各种蒙古文资料、网站之间不能兼容,信息不能共享,从而严重影响了蒙古文信息处理工作的发展。因此将不同厂商的蒙古文编码转换为统一的编码标准就成为了一项重要的工作。多种蒙古文编码自动识别工作是在不确定所属编码类型的情况下所做的识别工作,属于编码转换的前期工作,是下一步编码转换工作的基础。本文主要对智能、蒙科立、明安图三种编码规则做了分析后采用两种方法来做编码
4、识别工作。一种方法是根据蒙古文字母所属范围和在单词不同位置所表示的字型及编码不同来做的识别;另一种方法是采用蒙古文单词转拉丁后分音节而作的蒙古文识别。在具体的研究过程中,本文分别对蒙古文三种编码所属的编码范围、蒙古文编码的词首、词中、词末及独立形式做了深入研究并做了初步划分。此外还深入研究蒙古文的拉丁转写规则,对三种编码的蒙古文字母做了拉丁转写工作。本文还对蒙古文的分音节理论做了深入研究,根据分音节的规则,画出了蒙古文单词分音节划分流程图,并用该流程图对三种蒙古文编码的拉丁形式分别进行了分音节识别工作。关键词:编码识别;蒙古文编码范围;位置关系;拉丁转写;分音节多种蒙古
5、文编码自动识别方法的研究RESEARCHONAUTOM嗡TICRECOGNITIONMETHODOFMONGOLIANCODEABSTRACTWiththerapiddevelopmentofcomputertechnologyandnetworktechnology,theMongolianinformationprocessingworkhasmadegreatprogress.ButduetotherelativelagofMongolianinternationalstandardcodepromulgated,atpresent,thevarioussoftw
6、arevendorsinthemarkettotaketheirowncodingstandard,makethevariousMongolianinformationandwebsiteCannotbecompatible,theinformationCannotbeshared。whichseriouslyaffected也edevelopmentofMongolianinformationprocessingwork.Mongoliancodewillthereforebedifferentmanufacturersintoaunifiedcodingstanda
7、rdhasbecomeanimportantwork.Fordifferentcodeidentificationisidentificationworkfortheuncertaincodingtypeofcase,thepreliminaryworkWhichbelongstothecodeconversion,isthebasisforthenextcodeconversionwork.删spaperfocusesontheZhineng,MengkeliandMingantu,threekindsofcodingruleswere
此文档下载收益归作者所有