php中DOMDocument對於xml操作我們只要是英文是沒有問題了,但如果是中文字體就會有亂碼問題了,下面我們就此問題給各位介紹一些解決辦法吧.
PHP的DOM內部是utf8機制的,在loadHTML時,是通過檢查字符中meta的charset來設置編碼的,如果沒有charset,就當iso8859進行處理了,而這種情況下進行saveXML時,輸出來的卻是utf8,所以就看到亂碼了.
這麼說是不是還不太理解,舉個例子:
$xml = new DOMDocument(); @$xml->loadHTML('<div>我就是測試看看</div>'); $dom = new DOMXPath($xml); echo $dom->query('//div')->item(0)->saveXML();
打開網頁執行,你會發現輸出亂碼了,那如何解決這個問題呢?有兩種方式.
第一種:在loadHTML的時候指定編碼,下面這段代碼引用自php.net官方文檔中的回復,代碼如下:
$doc = new DOMDocument(); $doc->loadHTML('<?xml encoding="UTF-8">' . $html); foreach ($doc->childNodes as $item) { if ($item->nodeType == XML_PI_NODE) { $doc->removeChild($item); // remove hack } } $doc->encoding = 'UTF-8'; // insert proper
第二種方法:通過iconv對輸出的字符重新轉換,代碼如下:
echo iconv("UTF-8", "GB18030//TRANSLIT", $dom->saveXML($n) );
以上所述是小編給大家介紹的PHP 中 DOMDocument保存xml時中文出現亂碼問題的解決方案,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對幫客之家網站的支持!