MySQL存儲引擎及其面向的數據庫應用
由於工作的需要筆者有很長一段時間需要與開發人員進行溝通,並在必要時展開相關的培訓工作。在這個過程中,筆者發現大多數開發人員不知道MySQL的存儲引擎概念,這可能和他們以往開發的數據庫應用如Microsoft SQL Server、Oracle、DB2等有關。而在MySQL數據庫中,存儲引擎的概念顯得尤為重要,每個存儲引擎可能面向一種特定或者最優的數據庫應用環境。
www.2cto.com
圖1-1顯示了MySQL數據庫的體系結構,可見MySQL數據庫由以下幾部分組成:
·連接池組件(Connection Pool)。
·管理服務和工具組件(Management Services &Utilities)。
·SQL接口組件(SQL Interface)。
·查詢分析器組件(Parser)。
·優化器組件(Optimizer)。
·緩沖組件(Caches & Buffers)。
·插件式存儲引擎(Pluggable Storage Engines)。
www.2cto.com
·物理文件(File system)。
圖 1-1MySQL數據庫的體系結構
SQL解析器、SQL優化器、緩沖池、存儲引擎等組件在每個數據庫中都存在,但不是每個數據庫都有這麼多存儲引擎。MySQL的插件式存儲引擎可以讓存儲引擎層的開發人員設計他們希望的存儲層,例如,有的應用需要滿足事務的要求,有的應用則不需要對事務有這麼強的要求;有的希望數據能持久存儲,有的只希望放在內存中,臨時並快速地提供對數據的查詢。下面將介紹MySQL數據庫中一些常用的存儲引擎及它們面向的數據庫應用。
InnoDB存儲引擎:
支持事務,其設計目標主要面向聯機事務處理(OLTP)的應用。其特點是行鎖設計、支持外鍵,並支持類似Oracle的非鎖定讀,即默認讀取操作不會產生鎖。從MySQL 5.5.8版本開始是默認的存儲引擎。
InnoDB存儲引擎將數據放在一個邏輯的表空間中,這個表空間就像黑盒一樣由InnoDB存儲引擎自身來管理。從MySQL 4.1(包括4.1)版本開始,可以將每個InnoDB存儲引擎的表單獨存放到一個獨立的ibd文件中。此外,InnoDB存儲引擎支持將裸設備(row disk)用於建立其表空間。
InnoDB通過使用多版本並發控制(MVCC)來獲得高並發性,並且實現了SQL標准的4種隔離級別,默認為REPEATABLE級別,同時使用一種稱為netx-key locking的策略來避免幻讀(phantom)現象的產生。除此之外,InnoDB存儲引擎還提供了插入緩沖(insert buffer)、二次寫(double write)、自適應哈希索引(adaptive hash index)、預讀(read ahead)等高性能和高可用的功能。
對於表中數據的存儲,InnoDB存儲引擎采用了聚集(clustered)的方式,每張表都是按主鍵的順序進行存儲的,如果沒有顯式地在表定義時指定主鍵,InnoDB存儲引擎會為每一行生成一個6字節的ROWID,並以此作為主鍵。
www.2cto.com
InnoDB存儲引擎是MySQL數據庫最為常用的一種引擎,Facebook、Google、Yahoo等公司的成功應用已經證明了InnoDB存儲引擎具備高可用性、高性能以及高可擴展性。對其底層實現的掌握和理解也需要時間和技術的積累。如果想深入了解InnoDB存儲引擎的工作原理、實現和應用,可以參考《MySQL技術內幕:InnoDB存儲引擎》一書。
MyISAM存儲引擎:
不支持事務、表鎖設計、支持全文索引,主要面向一些OLAP數據庫應用,在MySQL 5.5.8版本之前是默認的存儲引擎(除Windows版本外)。數據庫系統與文件系統一個很大的不同在於對事務的支持, MyISAM存儲引擎是不支持事務的。究其根本,這也並不難理解。用戶在所有的應用中是否都需要事務呢?在數據倉庫中,如果沒有ETL這些操作,只是簡單地通過報表查詢還需要事務的支持嗎?此外,MyISAM存儲引擎的另一個與眾不同的地方是,它的緩沖池只緩存(cache)索引文件,而不緩存數據文件,這與大多數的數據庫都不相同。
NDB存儲引擎:
2003年,MySQL AB公司從Sony Ericsson公司收購了NDB 存儲引擎。NDB存儲引擎是一個集群存儲引擎,類似於Oracle的RAC集群,不過與Oracle RAC的 share everything結構不同的是,其結構是share nothing的集群架構,因此能提供更高級別的高可用性。NDB存儲引擎的特點是數據全部放在內存中(從5.1版本開始,可以將非索引數據放在磁盤上),因此主鍵查找(primary key lookups)的速度極快,並且能夠在線添加NDB數據存儲節點(data node)以便線性地提高數據庫性能。由此可見,NDB存儲引擎是高可用、高性能、高可擴展性的數據庫集群系統,其面向的也是OLTP的數據庫應用類型。
Memory存儲引擎:
正如其名,Memory存儲引擎中的數據都存放在內存中,數據庫重啟或發生崩潰,表中的數據都將消失。它非常適合於存儲OLTP數據庫應用中臨時數據的臨時表,也可以作為OLAP數據庫應用中數據倉庫的維度表。Memory存儲引擎默認使用哈希索引,而不是通常熟悉的B+樹索引。
www.2cto.com
Infobright存儲引擎:
第三方的存儲引擎。其特點是存儲是按照列而非行的,因此非常適合OLAP的數據庫應用。其官方網站是http://www.infobright.org/,上面有不少成功的數據倉庫案例可供分析。
NTSE存儲引擎:
網易公司開發的面向其內部使用的存儲引擎。目前的版本不支持事務,但提供壓縮、行級緩存等特性,不久的將來會實現面向內存的事務支持。
MySQL數據庫還有很多其他存儲引擎,上述只是列舉了最為常用的一些引擎。如果你喜歡,完全可以編寫專屬於自己的引擎,這就是開源賦予我們的能力,也是開源的魅力所在。
本文來自於和訊網