2006-05-22

dom4j解析的时候乱码

link: "java中文乱码解决方案和经验"

用DOM4J读节点数据的时候老出现中文乱码,我开始以为是DOM4J的问题,然后就查,最后看到一个解决方案,感觉不太爽,然后就接着找,后来不知道怎么就发现原来错误不在DOM4J。

主要是我读文件后把它存成byte[]格式的了,然后直接
byte[] gdpBytes = retrieveBytes();
String text = new String(gdpBytes);
Document doc = DocumentHelper.parseText(text);


这样是不对滴,就在第二行出的问题,这个时候还需要作一下编码声明处理:
String text = new String(gdpBytes,"utf-8");

这样就OK了。还有几个连接,虽然没用到,但是以后可能有用:
1 2

No comments: