用PYTHON語言進行數據庫編程, 至少有六種方法可供采用. 我在實際項目中采用,不但功能強大,而且方便快捷.以下是我在工作和學習中經驗總結.
方法一:使用DAO (Data Access Objects)
這個第一種方法可能會比較過時啦.不過還是非常有用的. 假設你已經安裝好了PYTHONWIN,現在開始跟我上路吧……
找到工具欄上ToolsàCOM MakePy utilities,你會看到彈出一個Select Library的對話框, 在列表中選擇'Microsoft DAO 3.6 Object Library'(或者是你所有的版本).
現在實現對數據的訪問:
#實例化數據庫引擎
import win32com.client
engine = win32com.client.Dispatch("DAO.DBEngine.35")
#實例化數據庫對象,建立對數據庫的連接
db = engine.OpenDatabase(r"c:\temp\mydb.mdb")
現在你有了數據庫引擎的連接,也有了數據庫對象的實例.現在就可以打開一個recordset了. 假設在數據庫中已經有一個表叫做 'customers'. 為了打開這個表,對其中數據進行處理,我們使用下面的語法:
rs = db.OpenRecordset("customers")
#可以采用SQL語言對數據集進行操縱
rs = db.OpenRecordset("select * from customers where state = 'OH'")
你也可以采用DAO的execute方法. 比如這樣:
db.Execute("delete * from customers where balancetype = 'overdue' and name = 'bill'")
#注意,刪除的數據不能復原了J
EOF 等屬性也是可以訪問的, 因此你能寫這樣的語句:
while not rs.EOF:
print rs.Fields("State").Value
rs.MoveNext()
我最開始采用這個方法,感覺不錯.
方法二:使用Python DB API,Python ODBC modules(you can use ODBC API directly, but maybe it is difficult for most beginner.)
為了在Python裡面也能有通用的數據庫接口,DB-SIG為我們提供了Python數據庫.(欲知詳情,訪問DB-SIG的網站,http://www.python.org/sigs/db-sig/). Mark
Hammond的win32擴展PythonWin裡面包含了這些API的一個應用-odbc.pyd. 這個數據庫API僅僅開放了一些有限的ODBC函數的功能(那不是它的目的),但是它使用起來很簡單,而且在win32裡面是免費的.
安裝odbc.pyd的步驟如下:
1. 安裝python軟件包:
http://www.python.org/download/
2. 安裝Mark Hammond的最新版本的python win32擴展 - PythonWin:
http://starship.python.net/crew/mhammond/
3. 安裝必要的ODBC驅動程序,用ODBC管理器為你的數據庫配置數據源等參數
你的應用程序將需要事先導入兩個模塊:
dbi.dll - 支持各種各樣的SQL數據類型,例如:日期-dates
odbc.pyd – 編譯產生的ODBC接口
下面有一個例子:
import dbi, odbc # 導入ODBC模塊
import time # 標准時間模塊
dbc = odbc.odbc( # 打開一個數據庫連接 'sample/monty/spam' # '數據源/用戶名/密碼' )
crsr = dbc.cursor() # 產生一個cursor
crsr.execute( # 執行SQL語言
"""
SELECT country_id, name, insert_change_date FROM country ORDER BY name """ )
print 'Column descriptions:' # 顯示行描述
for col in crsr.description:
print ' ', col
result = crsr.fetchall() # 一次取出所有的結果
print '\nFirst result row:\n ', result[0] # 顯示結果的第一行
print '\nDate conversions:' # 看看dbiDate對象如何?
date = result[0][-1]
fmt = ' %-25s%-20s'
print fmt % ('standard string:', str(date))
print fmt % ('seconds since epoch:', float(date))
timeTuple = time.localtime(date)
print fmt % ('time tuple:', timeTuple)
print fmt % ('user defined:', time.strftime('%d %B %Y', timeTuple))
下面是結果:
-------------------------------輸出(output)----------------------------
Column descriptions:
('country_id', 'NUMBER', 12, 10, 10, 0, 0)
('name', 'STRING', 45, 45, 0, 0, 0)
('insert_change_date', 'DATE', 19, 19, 0, 0, 1)
First result row:
(24L, 'ARGENTINA', )
Date conversions:
standard string: Fri Dec 19 01:51:53 1997
seconds since epoch: 882517913.0
time tuple: (1997, 12, 19, 1, 51, 53, 4, 353, 0)
user defined: 19 December 1997
大家也可以去http://www.python.org/windows/win32/odbc.html看看,那兒有兩個Hirendra Hindocha寫的例子,還不錯.
注意, 這個例子中,結果值被轉化為Python對象了.時間被轉化為一個dbiDate對象.這裡會有一點限制,因為dbiDate只能表示UNIX時間(1 Jan 1970 00:00:00 GMT)之後的時間.如果你想獲得一個更早的時間,可能會出現亂碼甚至引起系統崩潰.*_*
方法三: 使用 calldll模塊
(Using this module, you can use ODBC API directly. But now the python version is 2.1, and I don’t know if other version is compatible with it. 老巫:-)
Sam Rushing的calldll模塊可以讓Python調用任何動態連接庫裡面的任何函數,厲害吧?哈.其實,你能夠通過直接調用odbc32.dll裡面的函數操作ODBC.Sam提供了一個包裝模塊odbc.py,就是來做這個事情的.也有代碼來管理數據源,安裝ODBC,實現和維護數據庫引擎 (Microsoft Access).在那些演示和例子代碼中,還有一些讓人側目的好東東,比如cbdemo.py,有一個信息循環和窗口過程的Python函數!
[你可以到Sam's Python Software去找到calldll的相關連接,那兒還有其他好多有趣的東西]
下面是安裝CALLDLL包的步驟:
1. 安裝PYTHON軟件包(到現在為止最多支持2.1版本)
2. 下載calldll-2001-05-20.zip:
ftp://squirl.nightmare.com/pub/python/python-ext/calldll-2001-05-20.zip
3. 在LIB路徑下面創建一個新路徑比如說:
c:\Program Files\Python\lib\caldll\
4. 在原目錄下解壓calldll.zip
5. 移動calldll\lib\中所有的文件到上面一個父目錄(calldll)裡面,刪除子目錄(lib)
6. 在CALL目錄裡面生成一個file __init__.py文件,象這樣:
# File to allow this directory to be treated as a python 1.5
package.
7. 編輯calldll\odbc.py:
在"get_info_word"和"get_info_long"裡面,改變"calldll.membuf"為"windll.membuf"
下面是一個怎麼使用calldll的例子:
from calldll import odbc
dbc = odbc.environment().connection() # create connection
dbc.connect('sample', 'monty', 'spam') # connect to db
# alternatively, use full connect string:
# dbc.driver_connect('DSN=sample;UID=monty;PWD=spam')
print 'DBMS: %s %s\n' % ( # show DB information
dbc.get_info(odbc.SQL_DBMS_NAME),
dbc.get_info(odbc.SQL_DBMS_VER)
)
result = dbc.query( # execute query & return results
"""
SELECT country_id, name, insert_change_date
FROM country
ORDER BY name
"""
)
print 'Column descriptions:' # show column descriptions
for col in result[0]:
print ' ', col
print '\nFirst result row:\n ', result[1] # show first result row
-------------------------------output(輸出)--------------------------------
DBMS: Oracle 07.30.0000
Column descriptions:
('COUNTRY_ID', 3, 10, 0, 0)
('NAME', 12, 45, 0, 0)
('INSERT_CHANGE_DATE', 11, 19, 0, 1)
First result row:
['24', 'ARGENTINA', '1997-12-19 01:51:53']
方法四: 使用ActiveX Data Object(ADO)
現在給出一個通過Microsoft's ActiveX Data Objects (ADO)來連接MS Access 2000數據庫的實例.使用ADO有以下幾個好處: 首先,與DAO相比,它能更快地連接數據庫;其次,對於其他各種數據庫(SQL Server, Oracle, MySQL, etc.)來說,ADO都是非常有效而方便的;再有,它能用於XML和文本文件和幾乎其他所有數據,因此微軟也將支持它比DAO久一些.
第一件事是運行makepy.盡管這不是必須的,但是它對於提高速度有幫助的.而且在PYTHONWIN裡面運行它非常簡單: 找到工具欄上ToolsàCOM MakePy utilities,你會看到彈出一個Select Library的對話框, 在列表中選擇’Microsoft ActiveX Data Objects 2.5 Library ‘(或者是你所有的版本).
然後你需要一個數據源名Data Source Name [DSN] 和一個連接對象. [我比較喜歡使用DSN-Less 連接字符串 (與系統數據源名相比,它更能提高性能且優化代碼)]
就MS Access來說,你只需要復制下面的DSN即可.對於其他數據庫,或者象密碼設置這些高級的功能來說,你需要去 [Control Panel控制面板 | 管理工具Administrative Tools | 數據源Data Sources (ODBC)]. 在那裡,你可以設置一個系統數據源DSN. 你能夠用它作為一個系統數據源名,或者復制它到一個字符串裡面,來產生一個DSN-Less 的連接字符串. 你可以在網上搜索DSN-Less 連接字符串的相關資料. 好了,這裡有一些不同數據庫的DSN-Less連接字符串的例子:SQL Server, Access, FoxPro, Oracle , Oracle, Access, SQL Server, 最後是 MySQL.
>>> import win32com.client
>>> conn = win32com.client.Dispatch(r'ADODB.Connection')
>>> DSN = 'PROVIDER=Microsoft.Jet.OLEDB.4.0;DATA SOURCE=C:/MyDB.mdb;'
>>> conn.Open(DSN)
經過上面的設置之後,就可以直接連接數據庫了:
首要的任務是打開一個數據集/數據表
>>> rs = win32com.client.Dispatch(r'ADODB.Recordset')
>>> rs_name = 'MyRecordset'
>>> rs.Open('[' + rs_name + ']', conn, 1, 3)
[1和3是常數.代表adOpenKeyset 和adLockOptimistic.我用它作為默認值,如果你的情況不同的話,或許你應該改變一下.進一步的話題請參考ADO相關材料.]
打開數據表後,你可以檢查域名和字段名等等
>>> flds_dict = {}
>>> for x in range(rs.Fields.Count):
... flds_dict[x] = rs.Fields.Item(x).Name
字段類型和長度被這樣返回A :
>>> print rs.Fields.Item(1).Type
202 # 202 is a text field
>>> print rs.Fields.Item(1).DefinedSize
50 # 50 Characters
現在開始對數據集進行操作.可以使用SQL語句INSERT INTO或者AddNew() 和Update()
>>> rs.AddNew()
>>> rs.Fields.Item(1).Value = 'data'
>>> rs.Update()
這些值也能夠被返回:
>>> x = rs.Fields.Item(1).Value
>>> print x
'data'
因此如果你想增加一條新的記錄,不必查看數據庫就知道什麼number 和AutoNumber 字段已經產生了
>>> rs.AddNew()
>>> x = rs.Fields.Item('Auto_Number_Field_Name').Value
# x contains the AutoNumber
>>> rs.Fields.Item('Field_Name').Value = 'data'
>>> rs.Update()
使用ADO,你也能得到數據庫裡面所有表名的列表:
>>> oCat = win32com.client.Dispatch(r'ADOX.Catalog')
>>> oCat.ActiveConnection = conn
>>> oTab = oCat.Tables
>>> for x in oTab:
... if x.Type == 'TABLE':
... print x.Name
關閉連接. 注意這裡C是大寫,然而關閉文件連接是小寫的c.
>>> conn.Close()
前面提到,可以使用SQL語句來插入或者更新數據,這時我們直接使用一個連接對象.
>>> conn = win32com.client.Dispatch(r'ADODB.Connection')
>>> DSN = 'PROVIDER=Microsoft.Jet.OLEDB.4.0;DATA SOURCE=C:/MyDB.mdb;'
>>> sql_statement = "INSERT INTO [Table_Name]
([Field_1], [Field_2]) VALUES ('data1', 'data2')"
>>> conn.Open(DSN)
>>> conn.Execute(sql_statement)
>>> conn.Close()
最後一個例子經常被看作是ADO的難點.一般說來,想要知道一個表的RecordCount 的話,必須象這樣一個一個地計算他們 :
>>> # See example 3 above for the set-up to this
>>> rs.MoveFirst()
>>> count = 0
>>> while 1:
... if rs.EOF:
... break
... else:
... count = count + 1
... rs.MoveNext()
如果你也象上面那樣些程序的話,非常底效不說,如果數據集是空的話,移動第一個記錄的操作會產生一個錯誤.ADO提供了一個方法來糾正它.在打開數據集之前,設置CursorLocation 為3. 打開數據集之後,就可以知道recordcount了.
>>> rs.Cursorlocation = 3 # don't use parenthesis here
>>> rs.Open('SELECT * FROM [Table_Name]', conn) # be sure conn is open
>>> rs.RecordCount # no parenthesis here either