本文由秀依林楓提供友情贊助,首發於爛泥行天下。
說明本篇文章部分轉載自互聯網。
MySQL的Replication(英文為復制)是一個多MySQL數據庫做主從同步的方案,特點是異步復制,廣泛用在各種對MySQL有更高性能、更高可靠性要求的場合。與之對應的是另一個同步技術是MySQL Cluster,但因為MySQL Cluster配置比較復雜,所以使用者較少。
MySQL的Replication是一個異步復制的過程(mysql5.1.7以上版本分為異步復制和半同步兩種模式),它是從一個Mysql instance(instance英文為實例)(我們稱之為Master)復制到另一個Mysql instance(我們稱之slave)。在master與slave之間實現整個復制過程主要由三個線程來完成,其中兩個線程(SQL線程和IO線程)在slave端,另外一個線程(IO線程)在master端。
要實現MySQL的Replication,首先必須打開master端的binlog (mysql-bin.xxxxxx)日志功能,否則無法實現mysql的主從復制。因為mysql的整個主從復制過程實際上就是:slave端從master端獲取binlog日志,然後再在自己身上完全順序的執行該日志中所記錄的各種SQL操作。
有關具體如何開啟mysql的binlog日志功能,可以查看這篇文章《爛泥:學習mysql的binlog配置》。
MySQL主從復制的基本交互過程,如下:
1、slave端的IO線程連接上master端,並請求從指定binlog日志文件的指定pos節點位置(或者從最開始的日志)開始復制之後的日志內容。
2、master端在接收到來自slave端的IO線程請求後,通知負責復制進程的IO線程,根據slave端IO線程的請求信息,讀取指定binlog日志指定pos節點位置之後的日志信息,然後返回給slave端的IO線程。該返回信息中除了binlog日志所包含的信息之外,還包括本次返回的信息在master端的binlog文件名以及在該binlog日志中的pos節點位置。
3、slave端的IO線程在接收到master端IO返回的信息後,將接收到的binlog日志內容依次寫入到slave端的relaylog文件(mysql-relay-bin.xxxxxx)的最末端,並將讀取到的master端的binlog文件名和pos節點位置記錄到master-info(該文件存在slave端)文件中,以便在下一次讀取的時候能夠清楚的告訴master“我需要從哪個binlog文件的哪個pos節點位置開始,請把此節點以後的日志內容發給我”。
4、slave端的SQL線程在檢測到relaylog文件中新增內容後,會馬上解析該log文件中的內容。然後還原成在master端真實執行的那些SQL語句,並在自身按順豐依次執行這些SQL語句。這樣,實際上就是在master端和slave端執行了同樣的SQL語句,所以master端和slave端的數據是完全一樣的。
以上mysql主從復制交互過程比較拗口,理解起來也比較麻煩,我簡化了該交互過程。如下:
1、master在執行sql之後,記錄二進制log文件(bin-log)。
2、slave連接master,並從master獲取binlog,存於本地relay-log中,然後從上次記住的位置起執行SQL語句,一旦遇到錯誤則停止同步。
從以上mysql的Replication原理可以看出:
* 主從間的數據庫不是實時同步,就算網絡連接正常,也存在瞬間主從數據不一致的情況。
* 如果主從的網絡斷開,則從庫會在網絡恢復正常後,批量進行同步。
* 如果對從庫進行修改數據,那麼如果此時從庫正在在執行主庫的bin-log時,則會出現錯誤而停止同步,這個是很危險的操作。所以一般情況下,我們要非常小心的修改從庫上的數據。
* 一個衍生的配置是雙主、互為主從配置,只要雙方的修改不沖突,則可以工作良好。
* 如果需要多主庫的話,可以用環形配置,這樣任意一個節點的修改都可以同步到所有節點。