linux 下查看文件字符编码与转换编码

linux 下查看文件字符编码与转换编码

ID:21109969

大小:25.00 KB

页数:6页

时间:2018-10-19

linux 下查看文件字符编码与转换编码_第1页
linux 下查看文件字符编码与转换编码_第2页
linux 下查看文件字符编码与转换编码_第3页
linux 下查看文件字符编码与转换编码_第4页
linux 下查看文件字符编码与转换编码_第5页
资源描述:

《linux 下查看文件字符编码与转换编码》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Linux下查看文件字符编码和转换编码如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。一,查看文件编码:在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接查看文件编码:setfileencoding即可显示文件编码格式。如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,

2、那么你可以在~/.vimrc文件中添加以下内容:setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码$encafilenamefilename:Unive

3、rsaltransformationformat8bits;UTF-8CRLFlineterminators需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:Unrecognizedencoding二,文件编码转换1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式:setfileencoding=utf-82.iconv转换,iconv的命令格式如下:输入/输出格式规范:  -f,--from-code=名称原始文本编码  -t,--to-code=名称输出编码  信

4、息:Www.Svn8.Com  -l,--list列举所有已知的字符集  输出控制:  -c从输出中忽略无效的字符  -o,--output=FILE输出文件Svn8.Com  -s,--silent关闭警告  --verbose打印进度信息  -?,--help给出该系统求助列表  --usage给出简要的用法信息  -V,--version打印程序版本号  例子:  iconv-futf-8-tgb2312aaa.txt>bbb.txt  这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,

5、其输出定向到bbb.txt文件。iconv-fencoding-tencodinginputfile比如将一个UTF-8编码的文件转换成GBK编码iconv-fGBK-tUTF-8file1-ofile23.enconv转换文件编码比如要将一个GBK编码的文件转换成UTF-8编码,操作如下enconv-Lzh_CN-xUTF-8filename三,文件名编码转换:从Linux往windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文

6、件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。首先看一下你的系统上是否安装了convmv,如果没安装的话用:yum-yinstallconvmv安装。下面看一下convmv的具体用法:例如  convmv-fGBK-tUTF-8*.mp3  不过这个命令不会直正的转换,你可以看到转换

7、前后的对比。如果要直正的转换要加上参数--notest  convmv-fGBK-tUTF-8--notest*.mp3  -f参数是指出转换前的编码,-t是转换后的编码。这个千万不要弄错了。不然可能还是乱码哦。还有一个参数很有用。就是-r这个表示递归转换当前目录下的所有子目录。convmv-f源编码-t新编码[选项]文件名常用参数:-r递归处理子文件夹–notest真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。–list显示所有支持的编码–unescap可以做一下转义,比如把%20变成空格

8、比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:convmv-fUTF-8-tGBK–notestutf8编码的文件名这样转换以后”utf8编码的文件名”会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)四,vim编码方式的设置和所有的流行文本编辑器一样,Vim可以很好的编辑各种字符编码的文件,这当然包括UCS-2、UTF-8

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。