欢迎来到天天文库
浏览记录
ID:5322742
大小:41.50 KB
页数:4页
时间:2017-12-08
《java读取txt文本文件乱码解决方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Java读取TXT文本文件乱码解决方案今天在解析一个文本文件的时候出现了乱码,以前从未遇到,花了点时间解决了,在此总结一下:首先,先看一下解析的代码:privateString[]getProjectData(Filefile){String[]data=null;try{BufferedReaderbr=newBufferedReader(newFileReader(file));Stringstr=br.readLine();data=str.split("t");br.close();}catch(FileNot
2、FoundExceptione){e.printStackTrace();}catch(IOExceptione){e.printStackTrace();}returndata;}这个方法很简单,就是获取txt文件中的一行数据,然后转换为数组,我这个文本中只有一行。就这种情况下获取到的str是乱码,我想出现乱码肯定是字符集编码的问题,然后自己新建了一个文本文档测试没有问题(开始用的文本时别的程序导出的),所以我估计是开始那个txt文件编码的问题,查看发现是Unicode编码(如何查看txt的编码呢,教你一个笨笨的办法:
3、打开文件——另存为,然后看到最下面的编码,默认选择的就是当前文档的编码格式),问题就出现在这里。问题找到了就好解决了,修改代码为:privateString[]getProjectData(Filefile){String[]data=null;try{BufferedReaderbr=newBufferedReader(newInputStreamReader(newFileInputStream(file),"UTF-16"));Stringstr=br.readLine();data=str.split("t")
4、;br.close();}catch(FileNotFoundExceptione){e.printStackTrace();}catch(IOExceptione){e.printStackTrace();}returndata;}使用文件流读取,转换编码为“UTF-16”,这样乱码问题就解决了。归纳一下:txt文本文档有四种编码选项:ANSI、Unicode、Unicodebigendian、UTF-8;默认应该是ANSI选项,就是系统的默认编码,一般是GBK,这种情况下用第一段代码解析是没有问题的,也不需要转码;其
5、他格式就需要用第二段代码对应转码了,Unicode对应UTF-16,UTF-8就不用说了。关于获取txt文件编码,我们可能有时候需要用程序获取,动态判断,这里给一点资料,参考参考:ANSI:无格式定义Unicode:前两个字节为FFFEUnicode文档以0xFFFE开头Unicodebigendian:前两字节为FEFFUTF-8:前两字节为EFBBUTF-8以0xEFBBBF开头用程序取出前几个字节并进行判断即可。packagecom.syscan.oa.util;importjava.io.BufferedRead
6、er;importjava.io.BufferedWriter;importjava.io.File;importjava.io.FileNotFoundException;importjava.io.FileReader;importjava.io.FileWriter;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;publicclassReadWritTxtFileIO{publicstaticvoidmain(Str
7、ing[]args){//ReadDate();////WriteDate();Stringpath="d:/file4.txt";String[]str=writeToDat(path);System.out.println("str.length=="+str.length);for(inti=0;i8、ngth=="+splitStr.length);for(intj=0;j
8、ngth=="+splitStr.length);for(intj=0;j
此文档下载收益归作者所有