目前對文件的壓縮和解壓縮比較常用的格式就是zip格式和7z格式,今天就以一篇文章來融會貫通會該兩個壓縮文件格式的操作。
zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
參數file表示文件的路徑;參數mode指示打開zip文件的模式,有三種mode
默認值為'r',表示讀已經存在的zip文件,也可以為'w'或'a','w'表示新建一個zip文檔或覆蓋一個已經存在的zip文檔,‘a’表示追加壓縮
下面我們創建一個壓縮文件result.zip,並壓縮test文件夾下的所有文件
import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
z = zipfile.ZipFile(filename, 'w')
for d in os.listdir(testdir):
z.write(d)
z.close
當然上面還可以用with的方法打開
import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'w') as z:
for d in os.listdir(testdir):
z.write(d)
z.close
import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
z.extractall(testdir)
需要注意的是有些壓縮包解壓是有密碼,這時候調用extractall的時候也支持輸入密碼,在python3中,解壓文件的密碼參數 pwd 接收的是二進制的值,所以要在前面加一個 b
z.extractall(testdir,pwd=b"ftz")
import zipfile
import os
testdir = "D:\\FTZ\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
files = z.namelist()
print(files)
運行結果如下,返回的是一個列表:
import zipfile
import os
testdir = "D:\\ftz\\python_tool\\result\\test"
filename = "./result.zip"
with zipfile.ZipFile(filename, 'r') as z:
z.setpassword(b'ftz1') #設置zip文檔的密碼。
z.printdir() #將zip文檔內的信息打印到控制台上。
data = z.read('file.yaml') #獲取zip文檔內指定文件的二進制數據
print(data)
info = z.getinfo('file.yaml') #方法返回的是一個ZipInfo對象,表示zip文檔中相應文件的信息。它支持如下屬性
print("獲取文件名稱:",info.filename)
print("獲取文件最後修改時間:",info.date_time)
print("獲取壓縮類型:",info.compress_type)
print("獲取壓縮後的大小:",info.compress_size)
print("獲取未壓縮的文件大小:",info.file_size)
print("判斷是否是壓縮文件:",zipfile.is_zipfile(filename))
運行結果如下:
File Name Modified Size
data_yaml.yaml 2022-06-25 10:50:42 198
file.yaml 2022-06-25 10:13:46 123
vnfname.txt 2022-01-14 11:27:56 9320
b'\xe4\xb8\x80\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x98:\n \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x981:\n b:1\n c:2\n a:3\n \xe4\xba\x8c\xe7\xba\xa7\xe6\xa0\x87\xe9\xa2\x982:\n f:7\n t:8\n z:9'
獲取文件名稱: file.yaml
獲取文件最後修改時間: (2022, 6, 25, 10, 13, 46)
獲取壓縮類型: 0
獲取壓縮後的大小: 123
獲取未壓縮的文件大小: 123
判斷是否是壓縮文件: True
[Finished in 0.2s]
當然getinfo也支持其他的屬性,下面給出比較全的屬性和方法
ZipInfo.filename: 獲取文件名稱。
ZipInfo.date_time: 獲取文件最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)
ZipInfo.compress_type: 壓縮類型。
ZipInfo.comment: 文檔說明。
ZipInfo.extr: 擴展項數據。
ZipInfo.create_system: 獲取創建該zip文檔的系統。
ZipInfo.create_version: 獲取 創建zip文檔的PKZIP版本。
ZipInfo.extract_version: 獲取 解壓zip文檔所需的PKZIP版本。
ZipInfo.reserved: 預留字段,當前實現總是返回0。
ZipInfo.flag_bits: zip標志位。
ZipInfo.volume: 文件頭的卷標。
ZipInfo.internal_attr: 內部屬性。
ZipInfo.external_attr: 外部屬性。
ZipInfo.header_offset: 文件頭偏移位。
ZipInfo.CRC: 未壓縮文件的CRC-32。
ZipInfo.compress_size: 獲取壓縮後的大小。
ZipInfo.file_size: 獲取未壓縮的文件大小。
import py7zr
with py7zr.SevenZipFile('target.7z', 'w') as archive:
archive.writeall('/path/to/base_dir', 'base')
如果想設置密碼壓縮
import py7zr
with py7zr.SevenZipFile('target.7z', 'w', password='secret') as archive:
archive.writeall('/path/to/base_dir', 'base')
import py7zr
archive = py7zr.SevenZipFile('sample.7z', mode='r')
archive.extractall(path="/tmp")
archive.close()
也支持with模式
import py7zr
with py7zr.SevenZipFile('sample.7z', mode='r') as z:
z.extractall()
with py7zr.SevenZipFile('target.7z', 'w') as z:
z.writeall('./base_dir')
py7z也支持提取某個文件或者符合正則匹配的文件
import py7zr
import re
filter_pattern = re.compile(r'<your/target/file_and_directories/regex/expression>')
with SevenZipFile('archive.7z', 'r') as archive:
allfiles = archive.getnames()
selective_files = [f for f in allfiles if filter_pattern.match(f)]
archive.extract(targets=selective_files)
支持解壓縮加密的7z文件
import py7zr
with py7zr.SevenZipFile('encrypted.7z', mode='r', password='secret') as z:
z.extractall()