资源描述:
《藏文信息处理技术前景.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1999年青海师范大学学报(自然科学版)1999第1期JournalofQhinghaiNormalUniversity(NaturalScience)No.1藏文信息处理技术发展的广阔前景赵晨星杨兵(计算机系)摘要本文讨论藏文信息处理方面,应该急待研究开发的四大系统:文字处理系统、语音处理系统、翻译系统和文本电子出版物的必要性、技术处理方法和关键问题。关键词藏文信息处理文字处理语音处理翻译系统文本电子出版物藏族传统文化是人类世界文化宝库中的一朵奇葩,当今三大知识领域——人文科学、自然科学和精神科
2、学中,对精神科学的知识研究的比较透彻,成果丰富,为廿十一世纪人类文化的发展有着不可低估的影响。我们应该用最先进的藏文信息处理技术的手段,把这些藏族传统文化的丰富文献资料和经典整理出版,供给人们去研究,对它进行精度较高的机器翻译,供给全世界各文化领域的人们去吸取有用的东西,这是我们对人类文化的贡献,也是物质生产技术很高、产品极为丰富的今天,对精神文明和社会发展的极大贡献。藏族现代科学知识和人文科学是落后的,他们极需要发展教育文化、科学技术和经济生产,我们给他们提供一个藏文信息处理技术的新技术产品和手
3、段,可以促进他们的发展,尽快跟上发达地区。现在藏文信息处理技术在国内外具有一定的市场,我们应该抓住这个机会,研究开发出新的产品,供应市场。本文打算从四个方面对其开发的方向和产品性质进行论述。1文字处理系统文字处理系统是最常用的计算机应用软件,不论办公、商业、事务、教育、文化、政府部门、各行各业离不开它。开发藏文文字处理系统,应该分不同的档次:藏文操作系统平台,轻印刷系统、激光照排系统。1.1藏文操作系统平台以前研究开发的藏文操作系统,仅使用在MSDOS上,不能使用在WINDOWS系统中,字库仅是点
4、阵字库,无矢量字库、字体不美观。目前使用在WINDOWS上的应用软件很多,许多英文软件再不需要汉化(藏化)处理,直接在英文软件中可以上汉字、上藏字,这就要求有藏文的平软件系统台。中文之星是一个平台,但它的速度很慢,94年改进的新版本——中国龙,是一个很好的汉字平台,它有DOS版本,也有WINDOS版本,利用它,把藏文字库连接在它的字库上就可以实现藏汉文合壁的WINDOWS平台。中国龙是云南昆明明星电脑公司(SuperStarComputerCorp.KunMingChina,东风西路28号)的简易
5、(Jianjing)开发的,现在中国从94年5月以来很流行,大有取代中文之星的势第1期赵晨星等:藏文信息处理技术发展的广阔前景9头。1.2轻印刷系统所谓轻印刷系统,就是在点阵打印机上打出高质量的腊纸油印成印刷品,或者用激光打印机打出高质量的底稿样,用光电扫描仪扫出腊纸,再油印成印刷品。有的直接由计算机输出到腊纸扫描仪上,扫出腊纸而油印成印刷品。它的特点:¹点阵字库或矢量字库º利用24点阵打印机或激光打印机»简单的文字处理器,如Wordstar,WPS(WordProcessingSystem)等。
6、这样的系统也不难开发,只要做出正体、黑体、小草三种字体的点阵字库和矢量字库即可实现。中国现有的信通OA90上,用藏文的字库连接在它的各种字库上即行,工作量不是太大,要费三人年即行。再加上不同行业用的词组输入法,输入速度可以提高到每分钟300个字符以上,是世界上输入速度较快的操作系统了。1.3激光照排系统这种系统是专业排版系统,可以进行32开直到报版的排版。字体的种类多,字体的变化功能强。汉文的激光照排系统,中国有方正和华光两家比较有名,它们的字体达20多种,字体的变化功能也很强,图文并存,能制成胶
7、印用的胶片。最近用四分色法,作出彩色的照排系统,出版彩色的报纸、书刊。北大方正和华光的方法是把藏文字库和输入法挂上去,就成为汉藏混排的照排系统。但他们目前存在的问题是:¹藏文字库的字符不全。º藏文造字程序不好使用。»无好的字模,字不好看。¼无小草字体,无长体字体。½输入方法太差,不符合习惯的输入法,又慢,又不好学。华光的输入法比方正强一点,但还是不行。只要在上述五点上解决问题,就能搞出非常理想的系统来。2语音处理系统藏区由于地理分布的不同,形成了四个方言区,安多方言、康巴方言、卫藏方言、阿里方言,
8、目前阿里方言说的人数在国内不多,30多万阿里方言的藏族分布在拉达克(土尔基斯坦)和克什米尔(印度),国内一般说三大方言。这些方言之间是听不懂的,而用的文字是统一的,仅发音不同,方言的词汇也有所不同。正如象汉字一样,广州人、潮州人、上海人、福建人,各地区的发音不同,名词的方言不同而相互听不懂。所以造成藏区中,广播、电影、电视等声音的媒介产品相互听不懂,电视和电影的配音是两套或三套去发行,造成很大的困难,只得加藏文字幕去解决。如果搞一套三大方言的语音互译系统即就方便的多了。这类系统要解