程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> Python >> Python操作Excel 代碼

Python操作Excel 代碼

編輯:Python

1. Python 操作 Excel 的函數庫

我主要嘗試了 3 種讀寫 Excel 的方法:

1> xlrd, xlwt, xlutils: 這三個庫的好處是不需要其它支持,在任何操作系統上都可以使用。xlrd 可以讀取 .xls, .xlsx 文件,非常好用;但因為 xlwt 不能直接修改 Excel 文檔,必須得復制一份然後另存為其它文件,而且據說寫復雜格式的 Excel 文件會出現問題,所以我沒有選它來寫 Excel 文件。

2> openpyxl: 這個庫也是不需要其它支持的,而且據說對 Office 2007 格式支持得更好。遺憾地是,我經過測試,發現它加載 Excel 文件的效率比 xlrd 慢 3 倍以上,內存使用在 10 倍以上,於是就放棄了。

3> win32com: Python Win32 擴展,這個庫需要運行環境為 Windows+Office 對應版本。由於 Python Win32 擴展只是把 COM 接口包裝了一下,可以視為與 VBA 完全相同,不會有讀寫格式上的問題。嘗試了一下用 win32com 讀取 Excel 文件,效率還是比 xlrd 慢一些。

由於讀取效率上 xlrd > win32com > openpyxl,所以我自然選擇了 xlrd 用來讀取統計報表;而最終輸出的報表格式較復雜,所以選擇了 win32com 直接操作 Excel 文件。

2. Python 裡的關系型數據庫

SQLite 是一個非常輕量級的關系型數據庫,很多語言和平台都內置 SQLite 支持,也是 iOS 和 Android 上的默認數據庫。Python 的標准庫裡也包含了 sqlite3 庫,用起來非常方便。

3. 用 xlrd 讀取 Excel 並插入數據庫樣例

如果數據量不大,直接用 Python 內部數據結構如 dict, list 就夠了。但如果讀取的幾張表數據量都較大,增加個將數據插入數據庫的預處理過程就有很大好處。一是避免每次調試都要進行耗時較長的 Excel 文件載入過程;二是能充分利用數據庫的索引和 SQL 語句強大功能進行快速數據分析。

#!/usr/bin/python
# -*- coding: gbk -*-

import xlrd
import sqlite3

# 打開數據庫文件
device_city_db = sqlite3.connect('device_city.db')
cursor = device_city_db.cursor()

# 建表
cursor.execute('DROP TABLE IF EXISTS device_city')
cursor.execute('CREATE TABLE device_city (device_id char(16) PRIMARY KEY, city varchar(16))')
 
# 打開 device 相關輸入 Excel 文件
device_workbook = xlrd.open_workbook('輸入.xlsx')
device_sheet = device_workbook.sheet_by_name('設備表')

# 逐行讀取 device-城市 映射文件,並將指定的列插入數據庫
for row in range(1, device_sheet.nrows):
   device_id = device_sheet.cell(row, 6).value
   if len(device_id) > 16:
       device_id = device_id[0:16]
   if len(device_id) == 0:
       continue
   city = device_sheet.cell(row, 10).value
   # 避免插入重復記錄
   cursor.execute('SELECT * FROM device_city WHERE device_id=?', (device_id,))
   res = cursor.fetchone()
   if res == None:
       cursor.execute('INSERT INTO device_city (device_id, city) VALUES (?, ?)',
                      (device_id, city))
   else:
       if res[1] != city:
           print '%s, %s, %s, %s' % (device_id, city, res[0], res[1])
device_city_db.commit()

4. 將結果寫入 Excel 文件樣例

使用 win32com 寫入 Excel 的時候要注意,一定要記得退出 Excel,否則下次運行會出錯。這需要增加異常處理語句,我這裡偷了個懶,出了異常後要手動殺死任務管理器中的 excel 進程。至於 win32com 中類的接口,可以從 MSDN 網站查閱。

import win32com.client as win32
import os
excel = win32.gencache.EnsureDispatch('Excel.Application')
excel.Visible = False
# 貌似這裡只能接受全路徑
workbook = excel.Workbooks.Open(os.path.join(os.getcwd(), '輸出.xlsx'))
month_sheet = workbook.Worksheets(1)
# 計算文件中實際有內容的行數
nrows = month_sheet.Range('A65536').End(win32.constants.xlUp).Row
# 操作 Excel 單元格的值
for row in range(5, nrows-4):
   month_sheet.Cells(row, 1).Value += something
# 保存工作簿
workbook.Save()
# 退出 Excel
excel.Application.Quit()

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved