若符合這兩個條件,則可以說明這個數據庫的規范化水平還是比較高的。當然這是兩個泛泛而談的指標。為了達到數據庫設計規范化的要求,一般來說,需要符合以下五個要求。
要求一:表中應該避免可為空的列。 雖然表中允許空列,但是,空字段是一種比較特殊的數據類型。數據庫在處理的時候,需要進行特殊的處理。如此的話,就會增加數據庫處理記錄的復雜性。當表中有比較多的空字段時,在同等條件下,數據庫處理的性能會降低許多。
所以,雖然在數據庫表設計的時候,允許表中具有空字段,但是,我們應該盡量避免。若確實需要的話,我們可以通過一些折中的方式,來處理這些空字段,讓其對數據庫性能的影響降低到最少。
一是通過設置默認值的形式,來避免空字段的產生。如在一個人事管理系統中,有時候身份證號碼字段可能允許為空。因為不是每個人都可以記住自己的身份證號碼。而在員工報到的時候,可能身份證沒有帶在身邊。所以,身份證號碼字段往往不能及時提供。為此,身份證號碼字段可以允許為空,以滿足這些特殊情況的需要。但是,在數據庫設計的時候,則可以做一些處理。如當用戶沒有輸入內容的時候,則把這個字段的默認值設置為0或者為N/A。以避免空字段的產生。
二是若一張表中,允許為空的列比較多,接近表全部列數的三分之一。而且,這些列在大部分情況下,都是可有可無的。若數據庫管理員遇到這種情況,筆者建議另外建立一張副表,以保存這些列。然後通過關鍵字把主表跟這張副表關聯起來。將數據存儲在兩個獨立的表中使得主表的設計更為簡單,同時也能夠滿足存儲空值信息的需要。
要求二:表不應該有重復的值或者列。
如現在有一個進銷存管理系統,這個系統中有一張產品基本信息表中。這個產品開發有時候可以是一個人完成,而有時候又需要多個人合作才能夠完成。所以,在產品基本信息表產品開發者這個字段中,有時候可能需要填入多個開發者的名字。
如進銷存管理中,還需要對客戶的聯系人進行管理。有時候,企業可能只知道客戶一個采購員的姓名。但是在必要的情況下,企業需要對客戶的采購代表、倉庫人員、財務人員共同進行管理。因為在訂單上,可能需要填入采購代表的名字;可是在出貨單上,則需要填入倉庫管理人員的名字等等。
為了解決這個問題,有多種實現方式。但是,若設計不合理的話在,則會導致重復的值或者列。如我們也可以這麼設計,把客戶信息、聯系人都放入同一張表中。為了解決多個聯系人的問題,可以設置第一聯系人、第一聯系人電話、第二聯系人、第二聯系人電話等等。若還有第三聯系人、第四聯系人等等,則往往還需要加入更多的字段。
可是這麼設計的話,會產生一系列的問題。如客戶的采購員流動性比較大,在一年內換了六個采購員。此時,在系統中該如何管理呢?難道就建立六個聯系人字段?這不但會導致空字段的增加,還需要頻繁的更改數據庫表結構。明顯,這麼做是不合理的。也有人說,可以直接修改采購員的名字呀。可是這麼處理的話,會把原先采購訂單上采購員的名字也改變了。因為采購單上客戶采購員信息在數據庫中存儲的不是采購員的名字,而只是采購員對應的一個編號。在編號不改而名字改變了的情況下,采購訂單上顯示的就是更改後的名字。這不利於時候的追蹤。
所以,在數據庫設計的時候要盡量避免這種重復的值或者列的產生。筆者建議,若數據庫管理員遇到這種情況,可以改變一下策略。如把客戶聯系人另外設置一張表。然後通過客戶ID把供應商信息表跟客戶聯系人信息表連接起來。也就是說,盡量將重復的值放置到一張獨立的表中進行管理。然後通過視圖或者其他手段把這些獨立的表聯系起來。
要求三:表中記錄應該有一個唯一的標識符。
在數據庫表設計的時候,數據庫管理員應該養成一個好習慣,用一個ID號來唯一的標識行記錄,而不要通過名字、編號等字段來對紀錄進行區分。每個表都應該有一個ID列,任何兩個記錄都不可以共享同一個ID值。另外,這個ID值最好有數據庫來進行自動管理,而不要把這個任務給前台應用程序。否則的話,很容易產生ID值不統一的情況。
另外,在數據庫設計的時候,最好還能夠加入行號。如在銷售訂單管理中,ID號是用戶不能夠維護的。但是,行號用戶就可以維護。如在銷售訂單的行中,用戶可以通過調整行號的大小來對訂單行進行排序。通常情況下,ID列是以1為單位遞進的。但是,行號就要以10為單位累進。如此,正常情況下,行號就以10、20、30依次擴展下去。若此時用戶需要把行號為30的紀錄調到第一行顯示。此時,用戶在不能夠更改ID列的情況下,可以更改行號來實現。如可以把行號改為1,在排序時就可以按行號來進行排序。如此的話,原來行號為30的紀錄現在行號變為了1,就可以在第一行中顯示。這是在實際應用程序設計中對ID列的一個有效補充。這個內容在教科書上是沒有的。需要在實際應用程序設計中,才會掌握到這個技巧。
要求四:數據庫對象要有統一的前綴名。
一個比較復雜的應用系統,其對應的數據庫表往往以千計。若讓數據庫管理員看到對象名就了解這個數據庫對象所起的作用,恐怕會比較困難。而且在數據庫對象引用的時候,數據庫管理員也會為不能迅速找到所需要的數據庫對象而頭疼。
為此,筆者建立,在開發數據庫之前,最好能夠花一定的時間,去制定一個數據庫對象的前綴命名規范。如筆者在數據庫設計時,喜歡跟前台應用程序協商,確定合理的命名規范。筆者最常用的是根據前台應用程序的模塊來定義後台數據庫對象前綴名。如跟物料管理模塊相關的表可以用M為前綴;而以訂單管理相關的,則可以利用C作為前綴。具體采用什麼前綴可以以用戶的愛好而定義。但是,需要注意的是,這個命名規范應該在數據庫管理員與前台應用程序開發者之間達成共識,並且嚴格按照這個命名規范來定義對象名。
其次,表、視圖、函數等最好也有統一的前綴。如視圖可以用V為前綴,而函數則可以利用F為前綴。如此數據庫管理員無論是在日常管理還是對象引用的時候,都能夠在最短的時間內找到自己所需要的對象。
要求五:盡量只存儲單一實體類型的數據。 這裡將的實體類型跟數據類型不是一回事,要注意區分。這裡講的實體類型是指所需要描述對象的本身。筆者舉一個例子,估計大家就可以明白其中的內容了。如現在有一個圖書館裡系統,有圖書基本信息、作者信息兩個實體對象。若用戶要把這兩個實體對象信息放在同一張表中也是可以的。如可以把表設計成圖書名字、圖書作者等等。可是如此設計的話,會給後續的維護帶來不少的麻煩。
如當後續有圖書出版時,則需要為每次出版的圖書增加作者信息,這無疑會增加額外的存儲空間,也會增加記錄的長度。而且若作者的情況有所改變,如住址改變了以後,則還需要去更改每本書的記錄。同時,若這個作者的圖書從數據庫中全部刪除之後,這個作者的信息也就蕩然無存了。很明顯,這不符合數據庫設計規范化的需求。
遇到這種情況時,筆者建議可以把上面這張表分解成三種獨立的表,分別為圖書基本信息表、作者基本信息表、圖書與作者對應表等等。如此設計以後,以上遇到的所有問題就都引刃而解了。
以上五條是在數據庫設計時達到規范化水平的基本要求。除了這些另外還有很多細節方面的要求,如數據類型、存儲過程等等。而且,數據庫規范往往沒有技術方面的嚴格限制,主要依靠數據庫管理員日常工作經驗的累積。