錯誤提示
Invalid byte 1 of 1-byte UTF-8 sequence
原因分析
在中文版的window下java的默認的編碼為GBK,也就是所雖然我們標識了要將xml保存為utf-8格式但實際上文件是以GBK格式來保存的,所以這也就是為什麼能夠我們使用GBK、GB2312編碼來生成xml文件能正確的被解析,而以UTF-8格式生成的文件不能被xml解析器所解析的原因。
把xml的encoding屬性值UTF-8改為UTF8
org.xml.sax.SAXParseException: Content is not allowed in trailing section
把先要解析和字符串trim()一下即可解決問題。
解決:
1、最簡單就是把<?xml version="1.0" encoding="UTF-8"?>改成<?xml version="1.0" encoding="gbk"?>
2、或者把xml打開另存的時候把字符集改為UTF-8後保存
或改程序
復制代碼 代碼如下:
SAXReader reader = new SAXReader();
org.dom4j.Document document = reader.read("D:\ha.xml");
OutputFormat of = new OutputFormat();
of.setEncoding("UTF-8"); //改變編碼方式
XMLWriter writer = new XMLWriter(new FileWriter "d:\dom4j.xml"), of);