欢迎来到天天文库
浏览记录
ID:33925625
大小:408.01 KB
页数:5页
时间:2019-02-28
《linux内核多语言文件子系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、万方数据计算机科学2005V01.32No-.7Linux内核多语言文件子系统的设计与实现¨芮建武谢谦吴健孙玉芳(中国科学院软件研究所开放系统与中文信息处理中心北京100080)摘要操作系统的多语言支持是网络环境下计算机软件发展的必然结果。由于POSIX标准的国际化体系结构对多语言和分布式应用需求的支持有其局限性,导致遵循PoSIX标准的Linux文件予系统在支持多语言文本时可能造成数据丢失。本文从多语言角度考察了Linux文件子系统,重新构造了一个能够支持Urricode编码的逻辑文件系统EXT2U,改进了文件予系统,同时提供7基于Unicode编码的系统调用接口。通
2、过新文件系统与系统调用接1:2,为操作系统多语言处理提供了更好的基础。关键词文件子系统,多语言化,Unicode,EXT2UDesignandImplementationofLinuxFileSystemSupportingMultilingualismRUIJian-WuXIEQianWUJianSUNYu—Fang(OpenSystem&ChineseInformationProcessingCenter,InstituteofSoftware,ChineseAcademyofSciences,Beijing100080)AbstractMultilingualiz
3、ationofmodernoperatingsystemisnecessitatedontheInternet.SinceinternationalizationarchitecturecomplyingtOPOSIXhaslesssupportformuhilingualanddistributedapplications,LinuxfilesystemdirivedfromPOSIXmaylosedatainstoringsomemuhilingualtext.BasedonLinuxfilesystem,anewFileSystemcalledEXT2Uispre
4、sented,whichsupportsmetadataencodedbyUTF一16.Meanwhile,virtualfilesystemswitchinLinuxkernelisimprovedandasetofsystemcallsusingadatatypespecialtoUTF一16areproposed.bymeansofEXT2Uandnewsystemcalls,theabilitytoprocessmultilingualinformationcanbeachievedeasierinLinux.KeywordsFilesystem,Multili
5、ngualization,Urficode,EXT2U1问题的提出1.1多语言环境现代操作系统应为用户提供一个多语言环境。多语言环境要求:(1)为用户提供多语言用户界面,除用户可以选择自己使用的语言外。2)为开发人员提供多语言编程界面,使用应用程序具有输入与输出多种语言文本的支持。3)提供多语言信息的存储能力。其中,系统对多语言信息的存储是最基础的系统支持,由文件系统来实现。1.2文件系统与编码方案通常所说的文件系统可能包含以下的方面:(1)已格式化的存储介质,例如硬盘的一个已格式化分区;(2)存储在物理文件系统中的所有信息;(3)特定的文件组织格式,例如EXT2、FA
6、T32等文件系统格式,可以把它看作是逻辑文件系统;(4)操作系统中对物理文件系统中的信息进行管理和操作的模块。首先,不同的文件组织格式形成不同的逻辑文件系统,其实现是不相同的。其次,文件系统中存储的信息也与文件子系统的实现有关。我们把存储在物理文件系统上的信息分为两个类别:1)用户实际存放的信息;2)标识某一信息的信息,称为元信息。作为文件系统来说,最关键的是那些标识信息的信息。至于文件系统中文件的内容根据用户的需要存储,因此与文件系统结构本身无特别的关联。元信息对文件系统的组织结构至关重要。例如,如果用户需要把某些信息存储到文件名为“Linux系统混合文本示例”的文件
7、中,则文件系统将创建文件结构,把此文件结构的“名称”字段标记为“Linux系统混合文本示例”。当用户需要再次访问此文件时,文件系统会根据路径找到“Linux系统混合文本示例”文件的文件结构。查找过程中使用比较操作:把文件系统中的有关文件结构的“名称”字段信息与字符串“Linux系统混合文本示例”进行比较,如果找到匹配的文件结构记录,则此文件结构所指定的信息就是所要找的内容。可以看出,在进行字符串比较时,文件系统中文件结构的数据与要查找的字符串应该在编码上一致。计算机发展历程出现过许多的编码方案,相互之间未必兼容。这些编码方案包括:英文的A
此文档下载收益归作者所有