背景:我們在做數據遷移或者拆分的時候,使用Tablespace transcation 這種解決方案時,很有可能就會遇到 從庫復制出錯,報: Last_SQL_Errno: 1146
那麼具體錯誤內容可能會有如下:
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank discard tablespace'
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank import tablespace'
那麼我們遇到這樣的問題的時候該如何恰當的處理呢?考慮如下幾點:
1. 我們整個庫的容量有多大?
2. 業務容忍的最大延遲時間多久?
3. 我們恢復需要多久?恢復的難易程度如何?
通過考慮到以上幾點, 我們就可以根據實際情況做出抉擇,采用什麼樣的辦法盡快的恢復從庫;對於這樣的問題,簡單粗暴的方案就是重建從庫,當然還有別的辦法, 且聽我慢慢道來:
首先我們先看看我們是如何通過Transport tablespace 遷移數據的,大概步驟如下:
1.庫A執行: show create table xxx1; 拿到簡表語句;
2.庫B執行: create table xxx1; 在從庫上建立基本的表結構;
3.庫B執行: alter table xxx1 discard tablespace; 讓mysql自己刪掉ibd文件;
4.庫A執行: flush tables xxxx1,xxxx2 for export;把內存的髒數據刷到磁盤,使得ibd文件數據一致;
5.庫A執行: scp xxxx1.ibd xxx2.ibd xxxx1.cfg xxx2.cfg slave_host:/data/ 把ibd文件拷貝到從庫;
6.庫B執行: alter table xxx1 import tablespace 導入數據文件。
好了我們知道了整個遷移的具體步驟,那麼我們就可以輕松的應對在遷移過程中復制出錯的問題了。
那麼我們首先來看一下:
Last_SQL_Errno: 1146
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank discard tablespace'
其大概的意思就是我們在從庫上沒有找到 這個表的完整定義信息,觀察一下磁盤上的文件我們就明白了:
[root@GZ_NF_DB_RP_002 spider]# ls -lhrt |grep tb_city_population_rank
-rw-r----- 1 mysql mysql 8.3G Mar 31 20:03 tb_city_population_rank.ibd
果然沒有 這個表的 frm 文件, 那麼怎麼辦呢?由於是 slave 的sql_thread 線程報錯, 那麼我們可采取取巧的辦法:
用超級用戶登錄從庫,先備份一下 這個ibd 文件:[root@GZ_NF_DB_RP_002 spider]# mv tb_city_population_rank.ibd tb_city_population_rank.ibd.bak
然後拿到這個文件的表結構, 在從庫上執行建表語句,這樣一樣來, 我們從庫就有了 ibd frm 文件, 那麼 此時我們開啟slave sql_thread,這時就會執行時主庫傳過來的 語句:
alter table tb_city_population_rank discard tablespace ; 那麼當我們再一次的觀看此盤數據文件的時候,ibd 文件又不見了,此時slave 也就已經出錯了,其錯誤信息如下:
Last_SQL_Errno: 1146
Last_SQL_Error: Error 'Table 'spider.tb_city_population_rank' doesn't exist' on query. Default database: 'spider'. Query: 'alter table tb_city_population_rank import tablespace'
那麼我們此時需要做的就是: 把剛才mv 的文件 再 mv 回去, 也就是說:[root@GZ_NF_DB_RP_002 spider]# mv tb_city_population_rank.ibd.bak tb_city_population_rank.ibd ; 完成這個命令後我們再執行 start slave sql_thread ; 此時這個表就正常了, 我們可以執行select * from tb_city_population_rank limit 100; 來驗證一下是否可讀。
那麼此時,我們算完整的解決了因一個表導致的復制出錯的問題, 那麼如果遷移了多張表(經常是) , 那麼我們就可以按照這個解決方案,一步一步的來解決復制出錯。其大概的思路就是, 缺什麼我們補什麼,多了什麼我們去掉什麼。
下面是其它網友的補充,根據返回的錯誤信息進行調整即可。
mysql 主主復制(雙主復制)報錯Last_SQL_Errno: 1146
錯誤信息:
復制代碼 代碼如下:
Last_Errno: 1146
Last_Error: Error 'Table 'test.user' doesn't exist' on query. Default database: 'test'. Query: 'insert into user values(20,'在庫')'
解決方法:
mysql> set global sql_slave_skip_counter=20; mysql> STOP SLAVE; mysql> START SLAVE;
問題解決