通常用java來打包文件生成壓縮文件後,有如下兩個地方會出現亂碼 :
1、內容的中文亂碼問題,這個問題網上很多人給出了解決方法,主要有兩種方法:一是修改sun的源碼;另一個是使用開源的類庫org.apache.tools.zip.ZipOutputStream和org.apache.tools.zip.ZipEntry,這兩個類ant.jar中有,可以直接下載使用即可,毫無疑問,選擇後者更方便
2、壓縮文件注釋的中文亂碼問題:zos.setComment("中文測試");這個問題網上對應的解決方法資料較少。在自己機器上的工程創建的測試類,沒有任何問題,但是在公司的項目中使用一直出現亂碼,通過使用設置編碼的方法(zos.setEncoding("gbk");)終於發現了問題,測試項目的編碼方式為gbk,而公司項目的默認編碼是utf-8,所以測試項目沒問題而公司的項目中出現了問題。
org.apache.tools.zip.ZipOutputStream默認使用項目的編碼方式,理論上講utf-8也是支持中文的,實在想不通為啥還是亂碼,通過setEncoding方法改成gbk即可解決
針對上述問題的示例代碼如下:
package com.compress; import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.DataInputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.tools.zip.ZipEntry; import org.apache.tools.zip.ZipOutputStream; public class CompressEncodingTest { /** * @param args * @throws Exception */ public static void main(String[] args) throws Exception { File f = new File("中文測試.txt"); ZipOutputStream zos = new ZipOutputStream(new BufferedOutputStream( new FileOutputStream("zipTest.zip"), 1024)); zos.putNextEntry(new ZipEntry("中國人.txt")); DataInputStream dis = new DataInputStream(new BufferedInputStream( new FileInputStream(f))); zos.putNextEntry(new ZipEntry(f.getName())); int c; while ((c = dis.read()) != -1) { zos.write(c); } zos.setEncoding("gbk"); zos.setComment("中文測試"); zos.closeEntry(); zos.close(); } }