關於文件編碼的檢測,百度一下一大把都是,但是確實沒有能用的、很多人建議 mb_detect_encoding 檢測,可是不知為何我這不成功,什麼都沒輸出、看到有人寫了個增強版,用 BOM 判斷的,我果斷就無視了,這東西完全不靠譜、最終根據PHP手冊裡 mb_detect_encoding 函數下方的例子,自己寫了一個檢測函數,
還包括自動檢測編碼並按指點編碼讀取文件的函數、源碼獻上。
復制代碼 代碼如下:
<?php
/**
* 檢測文件編碼
* @param string $file 文件路徑
* @return string|null 返回 編碼名 或 null
*/
function detect_encoding($file) {
$list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
$str = file_get_contents($file);
foreach ($list as $item) {
$tmp = mb_convert_encoding($str, $item, $item);
if (md5($tmp) == md5($str)) {
return $item;
}
}
return null;
}
/**
* 自動解析編碼讀入文件
* @param string $file 文件路徑
* @param string $charset 讀取編碼
* @return string 返回讀取內容
*/
function auto_read($file, $charset='UTF-8') {
$list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
$str = file_get_contents($file);
foreach ($list as $item) {
$tmp = mb_convert_encoding($str, $item, $item);
if (md5($tmp) == md5($str)) {
return mb_convert_encoding($str, $charset, $item);
}
}
return "";
}