在數據庫中,對性能影響最大的包括數據庫的鎖策略、緩存策略、索引策略、存儲策略、執行計劃優化策略。
索引策略決定數據庫快速定位數據的效率,存儲策略決定數據持久化的效率。
1.索引不存儲null值。
更准確的說,單列索引不存儲null值,復合索引不存儲全為null的值。索引不能存儲Null,所以對這列采用is null條件時,因為索引上根本
沒Null值,不能利用到索引,只能全表掃描。
為什麼索引列不能存Null值?
將索引列值進行建樹,其中必然涉及到諸多的比較操作。Null值的特殊性就在於參與的運算大多取值為null。這樣的話,null值實際上是不能
參與進建索引的過程。也就是說,null值不會像其他取值一樣出現在索引樹的葉子節點上。
2.不適合鍵值較少的列(重復數據較多的列)。
假如索引列TYPE有5個鍵值,如果有1萬條數據,那麼 WHERE TYPE = 1將訪問表中的2000個數據塊。
再加上訪問索引塊,一共要訪問大於200個的數據塊。
如果全表掃描,假設10條數據一個數據塊,那麼只需訪問1000個數據塊,既然全表掃描訪問的數據塊
少一些,肯定就不會利用索引了。
3.前導模糊查詢不能利用索引(like '%XX'或者like '%XX%')
假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由於前面是
模糊的,所以不能利用索引的順序,必須一個個去找,看是否滿足條件。這樣會導致全索引掃描或者全表掃
描。如果是這樣的條件where code like 'A % ',就可以查找CODE中A開頭的CODE的位置,當碰到B開頭的
數據時,就可以停止查找了,因為後面的數據一定不滿足要求。這樣就可以利用索引了。
4.MySQL主要提供2種方式的索引:B-Tree索引,Hash索引。
B樹索引具有范圍查找和前綴查找的能力,對於有N節點的B樹,檢索一條記錄的復雜度為O(LogN)。相當於二分查找。
哈希索引只能做等於查找,但是無論多大的Hash表,查找復雜度都是O(1)。
顯然,如果值的差異性大,並且以等值查找(=、 <、>、in)為主,Hash索引是更高效的選擇,它有O(1)的查找復雜度。
如果值的差異性相對較差,並且以范圍查找為主,B樹是更好的選擇,它支持范圍查找。
MySQL中兩大主要存儲引擎MyISAM和InnoDB采用了不同的索引和存儲策略,本文將分析它們的異同和性能。