程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> 解析優化MySQL插入方法的五個妙招

解析優化MySQL插入方法的五個妙招

編輯：MySQL綜合教程

工作中遇到大概20萬的數據插入操作，程序編完後發現運行超時，修改PHP最大執行時間到600，還是超時，檢查超時前插入的數據條數推算一下，大概要處理40~60分鐘才能插入完成，看來程序寫的效率太低，得優化了。
測試電腦配置：
CPU：AMD Sempron(tm) Processor
內存：1.5G
語句如下：
復制代碼代碼如下:
$sql = "insert into `test` (`test`) values ('$content')";
for ($i=1;$i<1000;$i++) {
mysql_query($sql);
}
mysql_unbuffered_query　運行三次執行時間分別為：
9.85321879387
9.43223714828
9.46858215332
mysql_query　執行時間分別為：
10.0020229816
9.61053204536
9.24442720413
本人目前為止認為最高效率方式如下：
$sql = "insert into `test` (`test`) values ('$content')";
for ($i=1;$i<999;$i++) {
$sql .= ",('$content')";
}
mysql_query($sql);
執行時間為：
0.0323481559753
0.0371758937836
0.0419669151306

INSERT語句的速度
插入一個記錄需要的時間由下列因素組成，其中的數字表示大約比例：
連接：(3)
發送查詢給服務器：(2)
分析查詢：(2)
插入記錄：（1x記錄大小）
插入索引：（1x索引）
關閉：(1)
這不考慮打開表的初始開銷，每個並發運行的查詢打開。
表的大小以logN (B樹)的速度減慢索引的插入。
加快插入的一些方法：
· 如果同時從同一個客戶端插入很多行，使用含多個VALUE的INSERT語句同時插入幾行。這比使用單行INSERT語句快(在某些情況下快幾倍)。如果你正向一個非空表添加數據，可以調節bulk_insert_buffer_size變量，使數據插入更快。參見5.3.3節，“服務器系統變量”。
· 如果你從不同的客戶端插入很多行，能通過INSERT DELAYED語句加快速度。參見13.2.4節，“INSERT語法”。
· 用MyISAM，如果在表中沒有刪除的行，能在SELECT語句正在運行的同時插入行。
· 當從一個文本文件裝載一個表時，使用LOAD DATA INFILE。這通常比使用很多INSERT語句快20倍。
· 當表有很多索引時，有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列過程：

有選擇地用CREATE TABLE創建表。
執行FLUSH TABLES語句或命令mysqladmin flush-tables。
使用myisamchk --keys-used=0 -rq /path/to/db/tbl_name。這將從表中取消所有索引的使用。
用LOAD DATA INFILE把數據插入到表中，因為不更新任何索引，因此很快。
如果只想在以後讀取表，使用myisampack壓縮它。
用myisamchk -r -q /path/to/db/tbl_name重新創建索引。這將在寫入磁盤前在內存中創建索引樹，並且它更快，因為避免了大量磁盤搜索。結果索引樹也被完美地平衡。
執行FLUSH TABLES語句或mysqladmin flush-tables命令。

請注意如果插入一個空MyISAM表，LOAD DATA INFILE也可以執行前面的優化；主要不同處是可以讓myisamchk為創建索引分配更多的臨時內存，比執行LOAD DATA INFILE語句時為服務器重新創建索引分配得要多。
也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk --keys-used=0 -rq/path/to/db/tbl_name，使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q/path/to/db/tbl_name。使用這種方式，還可以跳過FLUSH TABLES。
· 鎖定表可以加速用多個語句執行的INSERT操作：
LOCK TABLES a WRITE;
INSERT INTO a VALUES (1,23),(2,34),(4,33);
INSERT INTO a VALUES (8,26),(6,29);
UNLOCK TABLES;
這樣性能會提高，因為索引緩存區僅在所有INSERT語句完成後刷新到磁盤上一次。一般有多少INSERT語句即有多少索引緩存區刷新。如果能用一個語句插入所有的行，就不需要鎖定。
對於事務表，應使用BEGIN和COMMIT代替LOCK TABLES來加快插入。
鎖定也將降低多連接測試的整體時間，盡管因為它們等候鎖定最大等待時間將上升。例如：
Connection 1 does 1000 inserts
Connections 2, 3, and 4 do 1 insert
Connection 5 does 1000 inserts
如果不使用鎖定，2、3和4將在1和5前完成。如果使用鎖定，2、3和4將可能不在1或5前完成，但是整體時間應該快大約40%。
INSERT、UPDATE和DELETE操作在MySQL中是很快的，通過為在一行中多於大約5次連續不斷地插入或更新的操作加鎖，可以獲得更好的整體性能。如果在一行中進行多次插入，可以執行LOCK TABLES，隨後立即執行UNLOCK TABLES(大約每1000行)以允許其它的線程訪問表。這也會獲得好的性能。
INSERT裝載數據比LOAD DATA INFILE要慢得多，即使是使用上述的策略。
· 為了對LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度，通過增加key_buffer_size系統變量來擴大鍵高速緩沖區。
INSERT語法
復制代碼代碼如下:
INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
       [INTO] tbl_name [(col_name,...)]
       VALUES ({expr | DEFAULT},...),(...),...
       [ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

或
復制代碼代碼如下:
INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
       [INTO] tbl_name
       SET col_name={expr | DEFAULT}, ...
       [ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

或
復制代碼代碼如下:
INSERT [LOW_PRIORITY | HIGH_PRIORITY] [IGNORE]
       [INTO] tbl_name [(col_name,...)]
       SELECT ...
       [ ON DUPLICATE KEY UPDATE col_name=expr, ... ]

一、DELAYED 的使用
使用延遲插入操作
DELAYED調節符應用於INSERT和REPLACE語句。當DELAYED插入操作到達的時候，
服務器把數據行放入一個隊列中，並立即給客戶端返回一個狀態信息，這樣客戶
端就可以在數據表被真正地插入記錄之前繼續進行操作了。如果讀取者從該數據
表中讀取數據，隊列中的數據就會被保持著，直到沒有讀取者為止。接著服務器
開始插入延遲數據行（delayed-row）隊列中的數據行。在插入操作的同時，服務器
還要檢查是否有新的讀取請求到達和等待。如果有，延遲數據行隊列就被掛起，
允許讀取者繼續操作。當沒有讀取者的時候，服務器再次開始插入延遲的數據行。
這個過程一直進行，直到隊列空了為止。
幾點要注意事項：
· INSERT DELAYED應該僅用於指定值清單的INSERT語句。服務器忽略用於INSERT DELAYED...SELECT語句的DELAYED。
· 服務器忽略用於INSERT DELAYED...ON DUPLICATE UPDATE語句的DELAYED。
· 因為在行被插入前，語句立刻返回，所以您不能使用LAST_INSERT_ID()來獲取AUTO_INCREMENT值。AUTO_INCREMENT值可能由語句生成。
· 對於SELECT語句，DELAYED行不可見，直到這些行確實被插入了為止。
· DELAYED在從屬復制服務器中被忽略了，因為DELAYED不會在從屬服務器中產生與主服務器不一樣的數據。
注意，目前在隊列中的各行只保存在存儲器中，直到它們被插入到表中為止。這意味著，如果您強行中止了mysqld（例如，使用kill -9）
或者如果mysqld意外停止，則所有沒有被寫入磁盤的行都會丟失。

二、IGNORE的使用
IGNORE是MySQL相對於標准SQL的擴展。如果在新表中有重復關鍵字，
或者當STRICT模式啟動後出現警告，則使用IGNORE控制ALTER TABLE的運行。
如果沒有指定IGNORE，當重復關鍵字錯誤發生時，復制操作被放棄，返回前一步驟。
如果指定了IGNORE，則對於有重復關鍵字的行，只使用第一行，其它有沖突的行被刪除。
並且，對錯誤值進行修正，使之盡量接近正確值。
insert ignore into tb(...) value(...)
這樣不用校驗是否存在了，有則忽略，無則添加

三、ON DUPLICATE KEY UPDATE的使用
如果您指定了ON DUPLICATE KEY UPDATE，並且插入行後會導致在一個UNIQUE索引或PRIMARY KEY中出現重復值，則執行舊行UPDATE。例如，如果列a被定義為UNIQUE，並且包含值1，則以下兩個語句具有相同的效果：
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)
       -> ON DUPLICATE KEY UPDATE c=c+1;

mysql> UPDATE table SET c=c+1 WHERE a=1;

如果行作為新記錄被插入，則受影響行的值為1；如果原有的記錄被更新，則受影響行的值為2。
注釋：如果列b也是唯一列，則INSERT與此UPDATE語句相當：
mysql> UPDATE table SET c=c+1 WHERE a=1 OR b=2 LIMIT 1;

如果a=1 OR b=2與多個行向匹配，則只有一個行被更新。通常，您應該盡量避免對帶有多個唯一關鍵字的表使用ON DUPLICATE KEY子句。

您可以在UPDATE子句中使用VALUES(col_name)函數從INSERT…UPDATE語句的INSERT部分引用列值。換句話說，如果沒有發生重復關鍵字沖突，則UPDATE子句中的VALUES(col_name)可以引用被插入的col_name的值。本函數特別適用於多行插入。 VALUES()函數只在INSERT…UPDATE語句中有意義，其它時候會返回NULL。
示例：
復制代碼代碼如下:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)
       -> ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);
本語句與以下兩個語句作用相同：
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)
       -> ON DUPLICATE KEY UPDATE c=3;
mysql> INSERT INTO table (a,b,c) VALUES (4,5,6)
       -> ON DUPLICATE KEY UPDATE c=9;

當您使用ON DUPLICATE KEY UPDATE時，DELAYED選項被忽略。