數據關系
在定義第四個正規化的形式前,我想首先提一下三種基本的數據關系:一對一,一對多和多對多。我們回頭看一下經過第一個正規化的users表。要是我們將url的字段放在一個獨立的表中,每次在users表中插入一個記錄,我們就會在urls表中插入一行。我們將得到一個一對一的關系:用戶表中的每一行,都將在urls表中找到相應的一行。對於我們的應用來 說,這既不實用也不標准。
然後看看第二個正規化的例子。對於每個用戶記錄,我們的表格允許有多個urls的記錄與之關聯。這是一個一對多的關系,這是一個很常見的關系。
對於多對多的關系來說,就有點復雜了。在我們的第三個正規化形式的例子中,我們的一個用戶與很多的url有關,而我們想將該結構變為允許多個用戶與多個的urls有關,這樣我們就可以得到一個多對多的結構。在討論前,我們先看看表格結構會有些什麼變化
users
userId name relCompId
1 Joe 1
2 Jill 2
companIEs
compId company company_address
1 ABC 1 Work Lane
2 XYZ 1 Job Street
urls
urlId url
1 abc.com
2 xyz.com
url_relations
relationId relatedUrlId relatedUserId
1 1 1
2 1 2
3 2 1
4 2 2
為了進一步減低數據的冗余,我們運用第四級正規化形式。我們創建了一個頗奇怪的url_relations表,裡面的字段均為主鍵或者foreign key。通過這個表,我們就可以消除urls表中的重復項目。以下是第四個正規化形式的具體要求:
第四個正規化形式
1.在一個多對多的關系中,獨立的實體不能存放在同一個表格中
由於它僅應用於多對多的關系,因此大多數的開發者可以忽略這條規定。不過在某些情況下,它是非常實用的,這個例子就是這樣,我們通過將相同的實體分離出來,並且將關系移到它們自己的表格中,從而改進了urls表格。
為了令你更容易明白,我們舉個具體的例子,以下將用一個SQL語句選擇出所有屬於joe的urls:
SELECT name, url FROM users, urls, url_relationsswheresurl_relations.relatedUserId = 1 AND
users.userId = 1 AND urls.urlId = url_relations.relatedUrlId
如果我們想要遍歷每個人的個人信息和url信息,我們可以這樣做:
SELECT name, url FROM users, urls, url_relationsswheresusers.userId = url_relations.relatedUserId AND
urls.urlId = url_relations.relatedUrlId
第五級正規化形式
還有一級正規化的形式,它並不常見,有點深奧,並且在大部分的情況下都是不必要的。它的原則是:
1.原來的表格必須可以通過由它分離出去的表格重新構建
使用這個規定的好處是,你可以確保不會在分離的表格中引入多余的列,所有你創建的表格結構都與它們的實際需要一樣大。應用這條規定是一個好習慣,不過除非你要處理一個非常大型的數據,否則你將不需要用到它。
希望這篇文章對你有用,並且可以幫助你在所有的項目中應用這些正規化的規定。你可能想知道這些方法是從哪來的,我可以告訴你,前面三個正規化的規定是1972年,Dr. E.F. Codd在他的論文“進一步正規化數據庫的關系模型中”提出的,其余的規定是經過後來的集合理論和關系數學家理論化的。