在優化查詢中,數據庫應用(如MySQL)即意味著對工具的操作與使用。使用索引、使用EXPLAIN分析查詢以及調整MySQL的內部配置可達到優化查詢的目的。
#1: 使用索引
MySQL允許對數據庫表進行索引,以此能迅速查找記錄,而無需一開始就掃描整個表,由此顯著地加快查詢速度。每個表最多可以做到16個索引,此外MySQL還支持多列索引及全文檢索。
給表添加一個索引非常簡單,只需調用一個CREATE INDEX命令並為索引指定它的域即可。列表A給出了一個例子:
列表 A
mysql> CREATE INDEX idx_username ON users(username);
Query OK, 1 row affected (0.15 sec)
Records: 1 Duplicates: 0 Warnings: 0
這裡,對users表的username域做索引,以確保在WHERE或者HAVING子句中引用這一域的SELECT查詢語句運行速度比沒有添加索引時要快。通過SHOW INDEX命令可以查看索引已被創建(列表B)。
列表 B
mysql> SHOW INDEX FROM users;
--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment |
--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
| users | 1 | idx_username | 1 | username | A | NULL | NULL | NULL | YES | BTREE | |
--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+
1 row in set (0.00 sec)
值得注意的是:索引就像一把雙刃劍。對表的每一域做索引通常沒有必要,且很可能導致運行速度減慢,因為向表中插入或修改數據時,MySQL不得不每次都為這些額外的工作重新建立索引。另一方面,避免對表的每一域做索引同樣不是一個非常好的主意,因為在提高插入記錄的速度時,導致查詢操作的速度減慢。這就需要找到一個平衡點,比如在設計索引系統時,考慮表的主要功能(數據修復及編輯)不失為一種明智的選擇。
#2: 優化查詢性能
在分析查詢性能時,考慮EXPLAIN關鍵字同樣很管用。EXPLAIN關鍵字一般放在SELECT查詢語句的前面,用於描述MySQL如何執行查詢操作、以及MySQL成功返回結果集需要執行的行數。下面的一個簡單例子可以說明(列表C)這一過程:
列表 C
mysql> EXPLAIN SELECT city.name, city.district FROM city, country WHERE city.countrycode = country.code AND country.code = 'IND';
+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------------+
| 1 | SIMPLE | country | const | PRIMARY | PRIMARY | 3 | const | 1 | Using index |
| 1 | SIMPLE | city | ALL | NULL | NULL | NULL | NULL | 4079 | Using where |
+----+-------------+---------+-------+---------------+---------+---------+-------+------+-------------+
2 rows in set (0.00 sec)這裡查詢是基於兩個表連接。EXPLAIN關鍵字描述了MySQL是如何處理連接這兩個表。必須清楚的是,當前設計要求MySQL處理的是country表中的一條記錄以及city表中的整個4019條記錄。這就意味著,還可使用其他的優化技巧改進其查詢方法。例如,給city表添加如下索引(列表D):
列表 D
mysql> CREATE INDEX idx_ccode ON city(countrycode);
Query OK, 4079 rows affected (0.15 sec)
Records: 4079 Duplicates: 0 Warnings: 0
現在,當我們重新使用EXPLAIN關鍵字進行查詢時,我們可以看到一個顯著的改進(列表E):
列表 E
mysql> EXPLAIN SELECT city.name, city.district FROM city, country WHERE city.countrycode = country.code AND country.code = 'IND';
+----+-------------+---------+-------+---------------+-----------+---------+-------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+---------+-------+---------------+-----------+---------+-------+------+-------------+
| 1 | SIMPLE | country | const | PRIMARY | PRIMARY | 3 | const | 1 | Using index |
| 1 | SIMPLE | city | ref | idx_ccode | idx_ccode | 3 | const | 333 | Using where |
+----+-------------+---------+-------+---------------+-----------+---------+-------+------+-------------+
2 rows in set (0.01 sec)
在這個例子中,MySQL現在只需要掃描city表中的333條記錄就可產生一個結果集,其掃描記錄數幾乎減少了90%!自然,數據庫資源的查詢速度更快,效率更高。
#3: 調整內部變量
MySQL是如此的開放,所以可輕松地進一步調整其缺省設置以獲得更優的性能及穩定性。需要優化的一些關鍵變量如下:
改變索引緩沖區長度(key_buffer) 一般,該變量控制緩沖區的長度在處理索引表(讀/寫操作)時使用。MySQL使用手冊指出該變量可以不斷增加以確保索引表的最佳性能,並推薦使用與系統內存25%的大小作為該變量的值。這是MySQL十分重要的配置變量之一,如果你對優化和提高系統性能有興趣,可以從改變key_buffer_size變量的值開始。
改變表長(read_buffer_size) 當一個查詢不斷地掃描某一個表,MySQL會為它分配一段內存緩沖區。read_buffer_size變量控制這一緩沖區的大小。如果你認為連續掃描進行得太慢,可以通過增加該變量值以及內存緩沖區大小提高其性能。
設定打開表的數目的最大值(table_cache) 該變量控制MySQL在任何時候打開表的最大數目,由此能控制服務器響應輸入請求的能力。它跟max_connections變量密切相關,增加table_cache值可使MySQL打開更多的表,就如增加max_connections值可增加連接數一樣。當收到大量不同數據庫及表的請求時,可以考慮改變這一值的大小。
對緩長查詢設定一個時間限制(long_query_time) MySQL帶有“慢查詢日志”,它會自動地記錄所有的在一個特定的時間范圍內尚未結束的查詢。這個日志對於跟蹤那些低效率或者行為不端的查詢以及尋找優化對象都非常有用。long_query_time變量控制這一最大時間限定,以秒為單位。