在動態網站的設計中,數據庫設計的重要性不言而喻。如果設計不當,查詢起來就非常吃力,程序的性能也會受到影響。無論你使用的是MySQL或者Oracle數據庫,通過進行正規化的表格設計,可以令你的PHP代碼更具可讀性,更容易擴展,從而也會提升應用的性能。
簡單說來,正規化就是在表格設計時,消除冗余性和不協調的從屬關系。在本文中,我將通過五個漸進的過程來告訴你在設計中應該了解的正規化技巧。從而建立一個可行而且效率高的數據庫。本文也會詳細分析一下可以利用的關系類型。
這裡假定我們要建立一個用戶信息的表格,其中要存儲用戶的名字、公司、公司地址和一些個人的收藏夾或url。在開始時,你可能定義一個如下的表格結構:
零狀態形式
users
name company company_address url1 url2
Joe ABC 1 Work Lane abc.com xyz.com
Jill XYZ 1 Job Street abc.com xyz.com
由於沒有進行任何的正規化處理,我們將這種形式的表稱為零狀態形式的表。留意其中的url1和url2字段---如果我們在應用中需要第三個url呢?這樣你就要在表格中多加一列,很明顯,這不是一個好辦法。如果你要創建一個富有擴展性的系統,你就要考慮使用第一個正規化的形式,並且應用到該表格中。
第一級正規化形式
1.消除每個表格中重復的組
2.為每套相關的數據建立一個獨立的表格
3.使用一個主鍵來標識每套相關的數據
以上的表格明顯違反了上面第一條的規定,那麼第三條的主鍵又是什麼意思呢?很簡單,它只是在每個記錄中加入一個唯一的、自動增加的整型值。通過這個值,就可以將兩個姓名一樣的記錄區分開來。通過應用第一級正規化形式,我們得到了以下的表格:
users
userId name company company_address url
1 Joe ABC 1 Work Lane abc.com
1 Joe ABC 1 Work Lane xyz.com
2 Jill XYZ 1 Job Street abc.com
2 Jill XYZ 1 Job Street xyz.com
現在我們的表格可以說已經處在第一級正規化的形式了,它已經解決了url字段的限制問題,不過這樣的處理後又帶來了一個新的問題。每次在user表中插入一條記錄的時候,我們都必須重復所有的公司和用戶數據。這樣不僅令數據庫比以前大了,而且很容易出錯。因此還要經過第二級正規化處理。
第二級正規化形式
1.為應用在多條記錄的字段建立獨立的表格
2.通過一個foreign key來關聯這些表格的值
我們將url的值放在一個獨立的表格中,這樣我們就可以在以後加入更多的數據,而無需擔心產生重復的值。我們還通過主鍵值來關聯這些字段:
users
userId name company company_address
1 Joe ABC 1 Work Lane
2 Jill XYZ 1 Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
如上所示,我們創建了獨立的表格,users表中的主鍵userid現在與url表中的foreign key relUserId關聯。現在的情況好象已經得到了明顯的改善。不過,如果我們要為ABC公司加入一個員工記錄呢?或者更多,200個?這樣我們就必須重復使用公司名和地址,這明顯不夠冗余。因此我們將應用第三級正規化方法:
第三級正規化形式
1.消除不依賴於該鍵的字段
公司名及地址與User Id都是沒有關系的,因此它們應用擁有自己的公司Id:
users
userId name relCompId
1 Joe 1
2 Jill 2
companIEs
compId company company_address
1 ABC 1 Work Lane
2 XYZ 1 Job Street
urls
urlId relUserId url
1 1 abc.com
2 1 xyz.com
3 2 abc.com
4 2 xyz.com
這樣我們就將companies表中的主鍵comId和users表中名字為relCompId的foreign key關聯起來,就算為ABC公司加入200個員工,在companIEs中也只有一條記錄。我們的users和urls表可以不斷地擴大,而無需擔心插入不必要的數據。大部分的開發者都認為經過三步的正規化就足夠了,這個數據庫的設計已經可以很方便地處理整個企業的負擔,此看法在大多數的情況下是正確的。