资源描述:
《论藏文序性及排序方法[1]》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、论藏文的序性及排序方法[1]中 文 信 息 学 报第14卷第1期JOURNALOFCHINESEINFORMATIONPROCESSINGVol.14No.1论藏文的序性及排序方法X江 荻1 周季文21中国社会科学院民族所计算语言学研究室 北京 1000812中央民族大学藏学系 北京 100081OntheSequenceofTibetanWordsandtheMethodofMakingSequence关键词 藏文 词典序 构造序 字符序摘要 为解决藏文排序问题,本文提出藏文的构造序和字符序概念,并在此基础上提出解决藏文词典序的计算机方案。文章对各类藏
2、文构造及字符进行了分析和赋值,给出了藏文计算机排序的技术流程图。JiangDiDepartmentofComputationalLinguistics,InstituteofNationalityStudiesChineseAcademyofSocialSciences Beijing 100081ZhouJiwenDepartmentofTibetology,CentralUniversityofNationalities Beijing 100081Abstract OnthebasisofcodedcharactersetsforTibetanin
3、formationprocessing,weneedtodis2cussthesequenceofTibetanwordsandthemethodofmakingsequence.First,weputforwardaconceptofconstructionsequenceforTibetanwords,whichismuchdifferentfromthesequenceofTibetantransliteration.TherearetwosequencesinTibetan,oneiswordorderindictionary,theotheri
4、scharacterorderinwordsaswellasinadictionary,andbothofthemmakethestructureinconceivablecomplexwithmulti2hierarchies.Secondly,wedesignawitprogrammetoassigndistinctivevaluestoallpossiblecharactersandcodingcharacters,whichmakethesequenceofTi2betanwordstoberealizedincomputer.Furthermo
5、re,weannounceourdiagramoftechnologicalprocess.Academicpresslimited.Keywords Tibetanlanguage Dictionarysequence Constructionsequence CharactersequenceX本文获中国社会科学院科研基金(95院重字-33)和中华社科基金(批准号97BMZ009)资助。本文已申请著作权登记,限于学术引用和翻译。本文于1998年12月16日收到56个辅音字母,10个梵音藏文字母,共40个基本字符;同时藏文字符还必须包括4个元音符号和3
6、个梵音藏文元音符号,以及作为上加字和下加字字符的变形基本辅音字母,另外还有其它数个组合用的梵音藏文的辅助读音符号。个辅音字母,10个梵音藏文字母,共40个基本字符;同时藏文字符还必须包括4个元音符号和3个梵音藏文元音符号,以及作为上加字和下加字字符的变形基本辅音字母,另外还有其它数个组合用的梵音藏文的辅助读音符号。一、引言藏文的序是个由来已久的问题,但真正较为科学作为辞书的检索序则是晚近才实现的,即藏文词典序。现代藏文词典序是按照传统藏文字的构造序而建立的排序方法,遵循严格的书面藏语构造规则。不过,由于藏文字符自身构造的复杂性以及大量梵音藏文等他族语字符
7、或科技字符的出现,藏文的序性仍是有待解决的问题。尤其是在藏文编码中国国家标准《信息技术信息交换用藏文编码字符集基本集》(GB16959-1997)正式发布实施后,藏文排序的理论和方法就更显得突出和重要。二、藏文序性概念书面藏语的“字”(或音节字)是由藏文字符和梵音藏文等字符构成的。藏文字符包括30藏文字符构成藏文字既有横向拼写又有纵向拼写,前加字、基字、后加字、重后加字是横向拼写,而其中包括基字在内的字元又有上加字、基字、下加字和元音符的纵向拼写,所以藏文字的结构十分复杂。字符在字中的特定位置可以称为“构造位”。各个构造位上出现的字符其性质与数量均有一定
8、的限制,相互之间也形成一种约束关系。藏文字的基本结构(不包括梵音藏文构造)中的构