php上傳文件是最最基礎的一個技術點,但是深入進去也有不少問題需要解決,這不,上傳中文文件後,文件名變成了亂碼。
下面是問題代碼,很簡單:
1 <html> 2 <body> 3 4 <form action="upload_file.php" method="post" 5 enctype="multipart/form-data"> 6 <label for="file">Filename:</label> 7 <input type="file" name="file" id="file" /> 8 <br /> 9 <input type="submit" name="submit" value="Submit" /> 10 </form> 11 12 </body> 13 </html>
1 <?php 2 if ($_FILES["file"]["error"] > 0) 3 { 4 echo "Return Code: " . $_FILES["file"]["error"] . "<br />"; 5 }else 7 { 8 echo "Upload: " . $_FILES["file"]["name"] . "<br />"; 9 echo "Type: " . $_FILES["file"]["type"] . "<br />"; 10 echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb<br />"; 11 echo "Temp file: " . $_FILES["file"]["tmp_name"] . "<br />"; 12 13 if (file_exists("upload/" . $_FILES["file"]["name"])) 14 { 15 echo $_FILES["file"]["name"] . " already exists. "; 16 } 17 else 18 { 19 move_uploaded_file($_FILES["file"]["tmp_name"], 20 "upload/" . $_FILES["file"]["name"]);
}
}
上傳了一個文件名為“測試數據.txt”的文件,oh ho,文件是傳上去了,但是文件名為亂碼。
網上搜索一下解決方案,將
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);
改成
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));
結果發現iconv函數返回值為false。
查一下函數手冊,發現第二個參數有特別的用法,簡單翻譯一下就是我可以在編碼的後面追加//TRANSLIT 或 //IGNORE ,前者會將無法翻譯的字符轉成最接近的字符,後者就是直接忽略不能轉化的字符。
試一下:
1 var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"])); 2 var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));
結果:
bool(false) string(4) ".txt"
也就是說中文都沒法轉化,甚至連接近的字符都沒有,看來網上介紹的方法也並非萬能。
猜測一下,也許我的系統在創建中文文件的時候會亂碼,於是我將代碼改寫了一下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/測試數據.txt");
結果創建成功,沒有亂碼。。。也就是說不是系統問題。
想一下,我的php文件本身是utf8編碼的,那麼
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/測試數據.txt");
這個語句肯定使用的是utf8編碼,那麼之前上傳的文件名肯定就不是utf8編碼了,那麼以下的語句肯定是錯誤的,因為源字符串本身就不是utf8編碼的:
iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);
使用函數檢查源字符串的編碼:
1 $e=mb_detect_encoding($text, array(‘UTF-8’, ‘GBK’,’gb2312’)); 2 echo $e;
結果是CP936,也就是源字符串編碼是GBK。
試一下
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));
問題解決,不再亂碼
實際上還有一種解決辦法,就是在html文件的head標簽中間加入
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
從而使編碼保持統一,也就不需要再轉碼了