在利用php解析xml時提示Invalid byte 1 of 1-byte UTF-8 sequence錯誤了,這個問題我百度查實說是編碼問題,結果我把編碼處理一下果然KO了,下面我來分享一下解決辦法。
錯誤提示
Invalid byte 1 of 1-byte UTF-8 sequence
原因分析
在中文版的window下java的默認的編碼為GBK,也就是所雖然我們標識了要將xml保存為utf-8格式但實際上文件是以GBK格式來保存的,所以這也就是為什麼能夠我們使用GBK、GB2312編碼來生成xml文件能正確的被解析,而以UTF-8格式生成的文件不能被xml解析器所解析的原因。
把xml的encoding屬性值UTF-8改為UTF8
org.xml.sax.SAXParseException: Content is not allowed in trailing section
把先要解析和字符串trim()一下即可解決問題。
解決:
1、最簡單就是把<?xml version="1.0" encoding="UTF-8"?>改成<?xml version="1.0" encoding="gbk"?>
2、或者把xml打開另存的時候把字符集改為UTF-8後保存
或改程序
代碼如下 復制代碼 SAXReader reader = new SAXReader();
org.dom4j.Document document = reader.read("D:\ha.xml");
OutputFormat of = new OutputFormat();
of.setEncoding("UTF-8"); //改變編碼方式
XMLWriter writer = new XMLWriter(new FileWriter "d:\dom4j.xml"), of);
我使用的是eclipse編輯器如下操作即可
可以在Eclipse中更改,在 eclipse 的功能表 [Project]→[Properties],?? [Resources],在右?的「Text file encoding」,把原?硎竅到y??的??,改? 「UTF-8」。