Consider Java: dom4j解析的时候乱码

2006-05-22

link: "java中文乱码解决方案和经验"

用DOM4J读节点数据的时候老出现中文乱码，我开始以为是DOM4J的问题，然后就查，最后看到一个解决方案,感觉不太爽，然后就接着找，后来不知道怎么就发现原来错误不在DOM4J。

主要是我读文件后把它存成byte[]格式的了，然后直接

byte[] gdpBytes = retrieveBytes();
String text = new String(gdpBytes);
Document doc = DocumentHelper.parseText(text);

这样是不对滴，就在第二行出的问题，这个时候还需要作一下编码声明处理：
String text = new String(gdpBytes,"utf-8");

这样就OK了。还有几个连接，虽然没用到，但是以后可能有用：
1 2

2006-05-22