Oracle數據庫是目前為止最復雜的一個數據庫之一。也正是這種復雜性,讓Oracle數據庫能夠面對企業各種各樣的需求。不過大部分時候,數據庫管理員掌握一些技巧,可以讓數據庫維護工作變得簡單。筆者這裡就以Oracle數據庫中表列的管理為例,談談這方面的問題。
一、 把列設置為UNUSED狀態,代替刪除。
當數據庫部署完成之後,即使在數據庫使用過程中,數據庫管理員仍然可以對數據庫的表進行維護,如刪除列等等。刪除列將刪除表中每條記錄的相應列的值,同時釋放其所占用的存儲空間。所以如果要刪除一個大表中的列時,由於其必須對每條記錄都進行相應的處理,為此這個刪除列的操作會占用比較長的時間。如有個數據庫管理員一次在設計一個人員管理系統時,一開始是把人員的住址跟人員信息表放置同一個表中。可是後來證明這個設計是錯誤的。一方面因為人員住址的字段比較長,而且有些由於住址難以確定,這個字段還是空的。另一方面,一個人員其可能住址變更了好幾次,而出於管理的需要,又要保存起以前的住址信息。為此最後一個人員可能同時對應多個住址信息。所以後來數據庫管理員調整了設計,另外建立了一張表,然後利用人員編號把它們關聯起來。由於那時表中的紀錄已經比較多了,如果要刪除列的話,那麼可能這個刪除作業需要執行時間比較長。
為了避免在數據庫使用高峰期間由於執行刪除列的操作而占用過多的系統資源(而且時間比較長),為此筆者建議不要馬上采用DROP關鍵字來刪除列。而可以先用UNUSED關鍵字把某個列設置為不活躍狀態。如可以利用命令ALTER TABLE ADRESS SET UNUSED,把某個列設置為不活躍。如此設置之後,從用戶的角度來看,被設置為UNUSED狀態的列於被直接刪除的列之間是沒有任何區別的。用戶無法通過查詢或者在數據字典中看到這些列。而且即使在表中,也可以插入相同列名的列。簡單的說,對於用戶來說,這個設置為UNUSED的列就好像刪除了一樣。但是從數據庫角度來說,在是不一樣的。其這個列只是別設置為UNUNSED列,但是在數據庫中仍然是存在的。也就是說,這個列所占用的存儲空間沒有被釋放。為此即使在數據庫運行的高峰時期,為列加入這個標記也不會占用多少的時間和系統資源。
為此,筆者的意見是,當數據庫比較繁忙時而且數據庫表中的紀錄又比較多,則可以不從物理上刪除這個列,而先把這個列標記為UNUSED狀態。這可以減少因為刪除列而給數據庫正常使用帶來的負面影響。雖然這要犧牲一點硬盤空間,可是現在硬盤便宜。為了數據庫的性能,犧牲這點硬盤空間是值得的。等到數據庫比較空的時候,再把這些列刪除即可。這對於用戶來說,是不會受到任何影響的。這只是在技術處理上的問題。
為了便於管理這些UNUSED列,在Oracle數據庫中還提供了一張視圖(這張視圖的名字為USER_UNUSED_COL_TABS),幫助數據庫管理員來管理這些列。通過查詢這張視圖,數據庫管理員可以了解數據庫哪些表中存在UNUSED列。然後數據庫管理員可以根據實際情況,一個月或者一年來清除一下。這不僅可以提高數據庫的運行效率,而且也不會因為刪除列的操作影響到用戶的正常使用。
二、 給列表添加相關的注釋。
俗話說,好記性不如爛筆頭。在數據庫設計的時候,給表或者列添加一些必要的注釋,可以提高其可讀性,也有利於後續的維護與升級。像筆者這種專業的數據庫設計與開發人員,往往一個人需要負責很多項目,即同時要負責多個企業的數據庫軟件。當項目數量一多,一年後可能就不知道某個數據庫的某張表到底用來做什麼用途。即使采用了比較合適的表名字編碼或者列名字編碼規則,但是憑借這些簡單的代碼,仍然不能夠直觀的反應出這些代碼的含義。為此,在必要的時候,我們往往需要給表或者列添加相關的注釋,方便後續對其進行維護與升級。
為了實現這個目的,我們可以利用COMMENT關鍵字。如COMMENT ON TABLE 表名 IS ‘注釋內容’即可。在使用這個命令的時候需要注意的是,注釋中的內容必須利用單引號括起來,而不是使用雙引號。因為如果注釋中含有特殊字符的話,如單引號、通配符等等,最好能夠采用其他的字符代替。如果非要用這些字符的話,那麼就需要采用轉義字符,讓數據庫系統認為這是普通的字符。通常情況下,注釋的內容可以多大4000個字節,足夠數據庫管理員用來表述表的用途。另外在注釋的內容中可以包含標點符號、空格字符、特殊字符(不建議使用)等等。而且還可以跨越多個物理行,以提高可讀性等等。不過雖然其提供了長達4000個字節的說明,但是數據庫管理員在寫注釋的時候,最好能夠短話短說。不然的話,以後要花大量的時間來讀這些備注的內容,可不是一件好差事。未必筆者認為,在寫這個表注釋的時候,最好能夠點到為止,而不要想寫項目說明書那樣寫的面面俱到。
除了給表添加注釋外,在Oracle數據庫中還可以給列添加注釋。這個添加的方法跟上面的類似,只需要把關鍵字ON TABLE更改為ON COLUMN 即可。當有多個人共同開發一個數據庫時,最好能夠在表或者列中添加必要的注釋。即使不在這裡添加說明,那麼在獨立的設計文檔中,也需要進行詳細的說明。一般情況下,筆者認為需要說明如下內容。一是創建者(誰創建的或者誰更新的);二是創建的時間(什麼時候創建或者什麼時候更新的);三是需要注明創建或者更新的目的;四是要注明這個列的一些約束條件。另外需要注意的是,如果後來有人更新這個表或者列的時候,如調整某個字段的大小,最好不要把原先的注釋覆蓋掉。而是直接在原有的注釋後面加入新的注釋。這些措施有利於後續的維護以及數據庫的升級。
三、 重新組織表。
有時候出於改善數據庫表的性能等目的出發,需要對Oralce數據庫的表進行重新組織。如在Oracle數據庫中,如果對表進行頻繁的DML操作,會使得這個表產生比較多的空間碎片與行遷移,從而給數據庫的性能帶來負面影響。這種情況在一些事務型的數據庫中是比較常見的。此時就需要重新組織表,如可以將移動一個位置,從而減少碎片,提高數據庫的性能。
大部分情況下,筆者都是利用ALTER TABLE MOVE語句來重新組織表。如可以利用這條語句,將某個表移動到同一個表空間的新數據段中。移動以後這對於用戶來說是沒有任何影響的。但是卻可以重建表的存儲結構,從而減少碎片,優化性能。當然,也可以利用這個語句把現有的表移動到其他的表空間中去。不過在使用這個語句的時候,數據庫管理員還是需要注意幾個限制。
一是在使用這條語句中要注意有足夠的空閒空間;如果在同一個表空間進行移動的話,則需要主要表空間能夠容納這個數據。這注意是因為,這個操作就好像是兩個操作結合而完成的一項操作。其首先將這個表復制到指定的位置,然後再刪除原來的表。也就是說,直到表被完全移到新的數據段中之後,數據庫才會刪除原來的數據段。所以這個空閒空間一定要保證,否則的話,就可能導致這個作業無法順利完成。
二是在利用這個語句重新組織表的過程中,原表的ROWID會發生改變。而這個值改變後最大的影響就會使得表中的索引失效。為此在使用這個語句重新組織表之後,就需要對此表重新建立索引。這也就是說,在短時間內用戶使用這個表會受到一定的影響。為此在執行這個操作的時候,最好能夠選擇數據庫比較空閒的時候。如果在執行這個語句時能夠暫時中斷用戶的連接,那時最好的。
數據庫管理員可以通過數據字典來查詢存儲空間的碎片狀態。如果碎片確實比較多的話,在筆者推薦使用這個語句來重新組織表,以減少碎片空間。如果整個數據庫存儲空間中都分布著大量的碎片,而不是個別表的問題,那麼就需要采用數據泵工具來重新組織全部的表,在最大程度上減少碎片。