存儲引擎
MySQL中的數據用各種不同的技術存儲在文件(或者內存)中。這些技術中的每一種技術都使用不同的存儲機制、索引技巧、鎖定水平並且最終提供廣泛的不同的功能和能力。通過選擇不同的技術,你能夠獲得額外的速度或者功能,從而改善你的應用的整體功能。
例如,如果你在研究大量的臨時數據,你也許需要使用內存存儲引擎。內存存儲引擎能夠在內存中存儲所有的表格數據。又或者,你也許需要一個支持事務處理的數據庫以確保事務處理不成功時數據的回退能力)。
這些不同的技術以及配套的相關功能在MySQL中被稱作存儲引擎(也稱作表類型)。MySQL默認配置了許多不同的存儲引擎,可以預先設置或者在MySQL服務器中啟用。你可以選擇適用於服務器、數據庫和表格的存儲引擎,以便在選擇如何存儲你的信息、如何檢索這些信息以及你需要你的數據結合什麼性能和功能的時候為你提供最大的靈活性。
選擇如何存儲和檢索你的數據的這種靈活性是MySQL為什麼如此受歡迎的主要原因。其它數據庫系統(包括大多數商業選擇)僅支持一種類型的數據存儲。遺憾的是,其它類型的數據庫解決方案采取的“一個尺碼滿足一切需求”的方式意味著你要麼就犧牲一些性能,要麼你就用幾個小時甚至幾天的時間詳細調整你的數據庫。使用MySQL,我們僅需要修改我們使用的存儲引擎就可以了。
在這篇文章中,我們不准備集中討論不同的存儲引擎的技術方面的問題(盡管我們不可避免地要研究這些因素的某些方面),相反,我們將集中介紹這些不同的引擎分別最適應哪種需求和如何啟用不同的存儲引擎。為了實現這個目的,在介紹每一個存儲引擎的具體情況之前,我們必須要了解一些基本的問題。
如何確定有哪些存儲引擎可用
你可以在MySQL(假設是MySQL服務器4.1.2以上版本)中使用顯示引擎的命令得到一個可用引擎的列表。
MySQL> show engines;
+------------+---------+----------------------------------------------------+
| Engine | Support | Comment |
+------------+---------+-----------------------------------------------------+
| MyISAM | DEFAULT | Default engine as of MySQL 3.23 with great performance |
| HEAP | YES | Alias for MEMORY |
| MEMORY | YES | Hash based, stored in memory, useful for temporary tables |
| MERGE | YES | Collection of identical MyISAM tables |
| MRG_MYISAM | YES | Alias for MERGE |
| ISAM | NO | Obsolete storage engine, now replaced by MyISAM |
| MRG_ISAM | NO | Obsolete storage engine, now replaced by MERGE |
| InnoDB | YES | Supports transactions, row-level locking, and foreign keys |
| INNOBASE | YES | Alias for INNODB |
| BDB | NO | Supports transactions and page-level locking |
| BERKELEYDB | NO | Alias for BDB |
| NDBCLUSTER | NO | Clustered, fault-tolerant, memory-based tables |
| NDB | NO | Alias for NDBCLUSTER |
| EXAMPLE | NO | Example storage engine |
| ARCHIVE | NO | Archive storage engine |
| CSV | NO | CSV storage engine |
+------------+---------+-------------------------------------------------------+
16 rows in set (0.01 sec) 這個表格顯示了可用的數據庫引擎的全部名單以及在當前的數據庫服務器中是否支持這些引擎。
對於MySQL 4.1.2以前版本,可以使用MySQL> show variables like "have_%"(顯示類似“have_%”的變量):
MySQL> show variables like "have_%";
+------------------+----------+
| Variable_name | Value |
+------------------+----------+
| have_bdb | YES |
| have_crypt | YES |
| have_innodb | DISABLED |
| have_isam | YES |
| have_raid | YES |
| have_symlink | YES |
| have_openssl | YES |
| have_query_cache | YES |
+------------------+----------+
8 rows in set (0.01 sec)
你可以通過修改設置腳本中的選項來設置在MySQL安裝軟件中可用的引擎。如果你在使用一個預先包裝好的MySQL二進制發布版軟件,那麼,這個軟件就包含了常用的引擎。然而,需要指出的是,如果你要使用某些不常用的引擎,特別是CSV、RCHIVE(存檔)和BLACKHOLE(黑洞)引擎,你就需要手工重新編譯MySQL源碼 。
使用一個指定的存儲引擎
你可以使用很多方法指定一個要使用的存儲引擎。最簡單的方法是,如果你喜歡一種能滿足你的大多數數據庫需求的存儲引擎,你可以在MySQL設置文件中設置一個默認的引擎類型(使用storage_engine 選項)或者在啟動數據庫服務器時在命令行後面加上--default-storage-engine或--default-table-type選項 。
更靈活的方式是在隨MySQL服務器發布同時提供的MySQL客戶端時指定使用的存儲引擎。最直接的方式是在創建表時指定存儲引擎的類型,向下面這樣:
CREATE TABLE mytable (id int, title char(20)) ENGINE = INNODB
你還可以改變現有的表使用的存儲引擎,用以下語句:
ALTER TABLE mytable ENGINE = MyISAM
然而,你在以這種方式修改表格類型的時候需要非常仔細,因為對不支持同樣的索引、字段類型或者表大小的一個類型進行修改可能使你丟失數據。如果你指定一個在你的當前的數據庫中不存在的一個存儲引擎,那麼就會創建一個MyISAM(默認的)類型的表。
各存儲引擎之間的區別
為了做出選擇哪一個存儲引擎的決定,我們首先需要考慮每一個存儲引擎提供了哪些不同的核心功能。這種功能使我們能夠把不同的存儲引擎區別開來。我們一般把這些核心功能分為四類:支持的字段和數據類型、鎖定類型、索引和處理。一些引擎具有能過促使你做出決定的獨特的功能,我們一會兒再仔細研究這些具體問題。
字段和數據類型
雖然所有這些引擎都支持通用的數據類型,例如整型、實型和字符型等,但是,並不是所有的引擎都支持其它的字段類型,特別是BLOG(二進制大對象)或者TEXT文本類型。其它引擎也許僅支持有限的字符寬度和數據大小。
這些局限性可能直接影響到你可以存儲的數據,同時也可能會對你實施的搜索的類型或者你對那些信息創建的索引產生間接的影響。這些區別能夠影響你的應用程序的性能和功能,因為你必須要根據你要存儲的數據類型選擇對需要的存儲引擎的功能做出決策。
鎖定
數據庫引擎中的鎖定功能決定了如何管理信息的訪問和更新。當數據庫中的一個對象為信息更新鎖定了,在更新完成之前,其它處理不能修改這個數據(在某些情況下還不允許讀這種數據)。
鎖定不僅影響許多不同的應用程序如何更新數據庫中的信息,而且還影響對那個數據的查詢。這是因為查詢可能要訪問正在被修改或者更新的數據。總的來說,這種延遲是很小的。大多數鎖定機制主要是為了防止多個處理更新同一個數據。由於向數據中插入信息和更新信息這兩種情況都需要鎖定,你可以想象,多個應用程序使用同一個數據庫可能會有很大的影響。
不同的存儲引擎在不同的對象級別支持鎖定,而且這些級別將影響可以同時訪問的信息。得到支持的級別有三種:表鎖定、塊鎖定和行鎖定。支持最多的是表鎖定,這種鎖定是在MyISAM中提供的。在數據更新時,它鎖定了整個表。這就防止了許多應用程序同時更新一個具體的表。這對應用很多的多用戶數據庫有很大的影響,因為它延遲了更新的過程。
頁級鎖定使用Berkeley DB引擎,並且根據上載的信息頁(8KB)鎖定數據。當在數據庫的很多地方進行更新的時候,這種鎖定不會出現什麼問題。但是,由於增加幾行信息就要鎖定數據結構的最後8KB,當需要增加大量的行,也別是大量的小型數據,就會帶來問題。
行級鎖定提供了最佳的並行訪問功能,一個表中只有一行數據被鎖定。這就意味著很多應用程序能夠更新同一個表中的不同行的數據,而不會引起鎖定的問題。只有InnoDB存儲引擎支持行級鎖定。
建立索引
建立索引在搜索和恢復數據庫中的數據的時候能夠顯著提高性能。不同的存儲引擎提供不同的制作索引的技術。有些技術也許會更適合你存儲的數據類型。
有些存儲引擎根本就不支持索引,其原因可能是它們使用基本表索引(如MERGE引擎)或者是因為數據存儲的方式不允許索引(例如FEDERATED或者BLACKHOLE引擎)。
事務處理
事務處理功能通過提供在向表中更新和插入信息期間的可靠性。這種可靠性是通過如下方法實現的,它允許你更新表中的數據,但僅當應用的應用程序的所有相關操作完全完成後才接受你對表的更改。例如,在會計處理中每一筆會計分錄處理將包括對借方科目和貸方科目數據的更改,你需要要使用事務處理功能保證對借方科目和貸方科目的數據更改都順利完成,才接受所做的修改。如果任一項操作失敗了,你都可以取消這個事務處理,這些修改就不存在了。如果這個事務處理過程完成了,我們可以通過允許這個修改來確認這個操作。