资源描述:
《基于unicode编码的蒙古文输入法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于Unicode编码的蒙古文输入法研究第24卷第6期2010年11月中文信息JOURNALOFCHINESEINFORMATIoNPROCESSINGVol.24,No.6NOV.,2010文章编号:1003—0077(2010)06—0120—05基于Unicode编码的蒙古文输入法研究范道尔吉,白风山,武慧娟(内蒙古大学电子信息工程学院,内蒙古呼和浩特010021)摘要:从Vista开始微软操作系统己经完全支持了传统蒙古文的输入,编辑和排版.该文在微软蒙古文输入法的基础上结合蒙古文的自身特点提
2、出了一种新型蒙古文输入法算法•该算法支持自动变形计算,自动联想输入,自动学习和资源共享等功能.文中给出了自动变形计算的原理和详细算法过程,并详细探讨了蒙古文字典数据的存储和使用方法,最后提出了自动学习算法和资源共享技术的解决方案.关键词濛古文输入法;Unicode;自动变形;Uniscribe中图分类号:TP391文献标识码:AResearchonMongolianlnputMethodinUnicodeFANDaoe-i.BAIFengshan,WUHuijtman(CollegeofElectr
3、onicInformationEngineering,NeiMongolUniversity,HohhotJnnerMongolia010021,China)Abstract:MicrosoftfSoperatingsystemhasstartedtOfullysupportthetraditionalMongolianinput,editingandtypesettinginVista.OnthebasisofMicrosoftMongolianinputmethod^thispaperpropo
4、sesanewalsorithmfortheMongolianinputbasedontheuniquecharacteristicsofMongolian.Thealgorithmsupportsautomaticdeformationcalculation,automaticassociationinput,automaticlearningandtheresourcesharing.Thispaperpresentsanauto一maticdeformationtheoryandadetail
5、edalgorithmforcomputingprocess.ItalsodiscussesthedetailsoftheMongo—liandictionarydatastorage.anddescribestheautomaticlearningalgorithmsandthesolutiontOtheresourcesha一ring.Keywords:Mongolianinputmethod;Unieode;automaticdeformation;Uniseribe1引言蒙古文国际标准编码字
6、符集中收录了传统蒙文的7个元音,27个辅音,1】个标点符号,10个数字和4个控制字符•该标准中只按蒙古文语音收入了抽象的蒙古文字符(称为名义字符),而同一个蒙古文字符的书写(显现形式)会根据其在词语屮的位置不同,单词的词性等属性不同而发生变化,即呈现在人们面前的是该字符变化后的形式(称为显现字形).由于ISO/IEC10646标准中没有收人蒙古文显现字符,因此在显示蒙文时需要将蒙古文的名义字符根据上下文映射到其相应的显现字形」]・微软的Vista操作系统当中已经支持了上述蒙古文的变换处理,0ffic
7、e2007也支持蒙古文的竖排排版.同时Vista中也提供了蒙古文输入法,但是这个输入法用起来不够方便,文字输入速度不够快.不方便Z处在于文字变形时候由用户判断使用哪一个控制符号,因此必须学习蒙古文的变形原理和控制符号功能,入门比较困难•其次蒙古文单词都比较长,平均有1O个左右(对一个蒙占文字典数据的统计),因此输入起来比较慢基于上述问题本文提出了一种新型蒙古文输入法算法.收稿日期:2009—10—17定稿日期:2010一01—13基金项目:内蒙古自治区教育厅项目(Z2007—1—01025)作者简介
8、:范道尔吉(198o一),男,研究生,讲师,主要研究方向为嵌人式系统,蒙古文信息化;白凤111(1964一),男,研究生,教授,主要研究方向为计算机与通信系统;武慧娟(1981—),女,研究生,讲师,主要研究方向为计算机与通信系统.6期范道尔吉等:基于Unicode编码的蒙古文输入法研究1212新输入法特点新输入法具备如下特点:a动变形,常用特殊文字快速输入,联想输入,自动学习和网络互联•自动变形是指用户只需按变形键文字就自动变形,用户选择正确变形就可以,而不用自己输