無論是在小得可憐的免費數據庫空間或是大型電子商務網站,合理的設計表結構、充分利用空間是十分必要的。這就要求我們對數據庫系統的常用數據類型有充分的認識。下面我就將我的一點心得寫出來跟大家分享。
一、數字類型
數字類型按照我的分類方法分為三類:整數類、小數類和數字類。
我所謂的“數字類”,就是指 DECIMAL 和 NUMERIC,它們是同一種類型。它嚴格的說不是一種數字類型,因為他們實際上是將數字以字符串形式保存的;他的值的每一位 (包括小數點) 占一個字節的存儲空間,因此這種類型耗費空間比較大。但是它的一個突出的優點是小數的位數固定,在運算中不會“失真”,所以比較適合用於“價格”、“金額”這樣對精度要求不高但准確度要求非常高的字段。
小數類,即浮點數類型,根據精度的不同,有 FLOAT 和 DOUBLE 兩種。它們的優勢是精確度,FLOAT 可以表示絕對值非常小、小到約 1.17E-38 (0.000...0117,小數點後面有 37 個零) 的小數,而 DOUBLE 更是可以表示絕對值小到約 2.22E-308 (0.000...0222,小數點後面有 307 個零) 的小數。FLOAT 類型和 DOUBLE 類型占用存儲空間分別是 4 字節和 8 字節。如果需要用到小數的字段,精度要求不高的,當然用 FLOAT 了。可是說句實在話,我們“民用”的數據,哪有要求精度那麼高的呢?這兩種類型至今我沒有用過――我還沒有遇到適合於使用它們的事例。
用的最多的,最值得精打細算的,是整數類型。從只占一個字節存儲空間的 TINYINT 到占 8 個字節的 BIGINT,挑選一個“夠用”並且占用存儲空間最小的類型是設計數據庫時應該考慮的。TINYINT、SMALLINT、MEDIUMINT、INT 和 BIGINT 占用存儲空間分別為 1 字節、2 字節、3 字節、4 字節和 8 字節,就無符號的整數而言,這些類型能表示的最大整數分別為 255、65535、16777215、4294967295 和 18446744073709551615。如果用來保存用戶的年齡 (舉例來說,數據庫中保存年齡是不可取的),用 TINYINT 就夠了;九城的《縱橫》裡,各項技能值,用 SMALLINT 也夠了;如果要用作一個肯定不會超過 16000000 行的表的 AUTO_INCREMENT 的 IDENTIFY 字段,當然用 MEDIUMINT 不用 INT,試想,每行節約一個字節,16000000 行可以節約 10 兆多呢。
二、日期時間類型
日期和時間類型比較簡單,無非是 DATE、TIME、DATETIME、TIMESTAMP 和 YEAR 等幾個類型。只對日期敏感,而對時間沒有要求的字段,就用 DATE 而不用 DATETIME 是不用說的了;單獨使用時間的情況也時有發生――使用 TIME;但最多用到的還是用 DATETIME。在日期時間類型上沒有什麼文章可做,這裡就不再詳述。
三、字符 (串) 類型
不要以為字符類型就是 CHAR,CHAR 和 VARCHAR 的區別在於 CHAR 是固定長度,只要你定義一個字段是 CHAR(10),那麼不論你存儲的數據是否達到了 10 個字節,它都要占去 10 個字節的空間;而 VARCHAR 則是可變長度的,如果一個字段可能的值是不固定長度的,我們只知道它不可能超過 10 個字符,把它定義為 VARCHAR(10) 是最合算的,VARCHAR 類型的占用空間是它的值的實際長度 +1。為什麼要 +1 呢?這一個字節用於保存實際使用了多大的長度。從這個 +1 中也應該看到,如果一個字段,它的可能值最長是 10 個字符,而多數情況下也就是用到了 10 個字符時,用 VARCHAR 就不合算了:因為在多數情況下,實際占用空間是 11 個字節,比用 CHAR(10) 還多占用一個字節。
舉個例子,就是一個存儲股票名稱