中俄网络语言编码接口问题的研究

中俄网络语言编码接口问题的研究

ID:9293138

大小:30.00 KB

页数:8页

时间:2018-04-26

中俄网络语言编码接口问题的研究_第1页
中俄网络语言编码接口问题的研究_第2页
中俄网络语言编码接口问题的研究_第3页
中俄网络语言编码接口问题的研究_第4页
中俄网络语言编码接口问题的研究_第5页
资源描述:

《中俄网络语言编码接口问题的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、中俄网络语言编码接口问题的研究中俄网络语言编码接口问题的研究中俄网络语言编码接口问题的研究中俄网络语言编码接口问题的研究中俄网络语言编码接口问题的研究中俄网络语言编码接口问题的研究>  0引言  研究中俄文互译和接口标准关系,能得中国科技企业面向俄语世界的网络贸易工作都能达到更好的经济效果。本文针对核心中俄文互通问题,整合与集成不同文化背景的网络符号互译与信息交换的标准接口问题,研究中俄文字符号在网络上的应用规律和特点,注意与计算机搜索引擎技术的协调配合,提高本研究的持续适应能力,形成具有统一性的国际协议。本项目实施相对长期的客户支持,能促进中国对俄语系2

2、1国家的电子商务活动,激励大众创业和万众创新,最终实现中俄电子商务合作的国际市场化应用。  1编码分析  中俄网络语言编码接口技术,通过合作研究GB2312和UTF-8编码技术的转换技术解决中俄网络语言编程编码接口问题,无论是俄文网站,还是中文网站,都能确保文字符号在,中、俄两个国家适用的操作平台上正常显示运行。  1.1编码集  完成GB2312和UTF-8编码技术转换的研发工作,实现异构系统之间的互联互通,制定统一的信息标准。由于缺乏编码方案来解决中俄这两种不同语言体系在计算机语言中表示的问题,从而导致一直以来中国的商品基本上通过欧美、日、韩等国家转销

3、至俄语世界,原因在于他们拥有通往俄语国家的信息交流通道,UTF-8编码接轨较早。为了通过网络技术,给中俄企业沟通、交流、发布及获取信息提供直接的渠道,双方需要有设计全新的编码模型方案解决中俄这两种不同语言体系在计算机语言中表示的问题。  1.1.1GB2312  GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB2312。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位

4、来对汉字进行编码,称为区位码。同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。  1.1.2Unicode  Unicode是为了解决传统的字符编码方案的局限而产生的,例如ISO8859-1:Latin-1,是西欧常用859-1所定义的字符,使既有的西欧语系文字的转换不需特别处理;并且把大量相同的字符重复编到不同的字符码中去,使得旧有纷杂的编码方式得以和Unicode编码间互相直接转换,而不

5、会丢失任何信息。在文字处理方面,Unicode为每一个字符而非字形定义唯一的代码(即一个整数)。以一种抽象的方式即数字)来处理字符,并将视觉上的演绎工作:例如字体大小、外观形状、字体形态、文体等)留给其他软件来处理,例如网页浏览器或是文字处理器。UNICODE用2个字节编码,它通过增加一个高字节对ISOLatm-1字符集进行扩展,可以用ASCII表示的字符使用UNICODE并不高效,因为UNICODE比ASCII占用大一倍的空间,而对ASCII来说高字节的0对他毫无用处。为了解决这个问题,就出现了一些中间格式的字符集,他们被称为通用转换格式,即UTFUni

6、versalTransformationFormat)。常见的UTF格式有:UTF-7,UTF-7.5,UTF-8,UTF-16,以及UTF-32。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言如英文、日文、韩文)。  1.2中俄文字差别  1.2.1中文双字节  GB2312和UTF-8编码技术转换的研发工作,实现异构系统之间的互联互通,制定统一的信息标准。在两国架设的服务器设备中同时嵌入中俄两国的标准字符库,为数据汇总和数据交换中的数据冲突问题提供完善的解决方案,从而避免在境外使用出现的文字乱码现象。汉

7、字是双字节而一些汉字编辑软件并没有充分认识到这一点,例如:汉化对光标移动、删除等还是按单字节方式处理,16*16俄文,8*16俄文字都是单字节的,给用户造半个字显示的混乱的后果。  1.2.2俄文重形式  俄语是庄重的书面体语体,它的商务行文简练,语法比较严谨,重点也突出,言辞极具数学逻辑性和技术准确性,交流要求尽可能准确地描述和解释一定的事实。俄罗斯人更加接近西方世界的直观式思维方式。强调由细节部到整体部,由外表到内涵的分析思路。比较理性的思维,注重形式的论证过程,不喜欢采用艺术比喻手段,追求语义简明且凝练,要求明白、并且直露。  1.2.3俄文多语格 

8、 俄语符号文句在语法上是:使用非一致性定语的第二格的特点比例较高。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。