程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql 單機數據庫優化的一些理論

mysql 單機數據庫優化的一些理論

編輯：MySQL綜合教程

mysql 單機數據庫優化的一些理論。本站提示廣大學習愛好者：（mysql 單機數據庫優化的一些理論）文章只能為提供參考，不一定能成為您想要的結果。以下是mysql 單機數據庫優化的一些理論正文

數據庫優化有許多可以講，依照支持的數據量來分可以分為兩個階段：單機數據庫和分庫分表，前者普通可以支持500W或許10G之內的數據，跨越這個值則須要斟酌分庫分表。別的，普通年夜企業面試常常會從單機數據庫問起，一步一步問到分庫分表，中央會交叉許多數據庫優化的成績。本文試圖描寫單機數據庫優化的一些理論，數據庫基於mysql，若有不公道的處所，迎接斧正。

1、表構造優化

在開端做一個運用的時刻，數據庫的表構造設計常常會影呼應用前期的機能，特殊是用戶量下去了今後的機能。是以，表構造優化是一個很主要的步調。

1.1、字符集

普通來講盡可能選擇UTF-8，固然在存正午的時刻GBK比UTF-8應用的存儲空間少，然則UTF-8兼容列國說話，其實我們不用為了這點存儲空間而就義了擴大性。現實上，前期假如要從GBK轉為UTF-8所要支付的價值是很高的，須要停止數據遷徙，而存儲空間完整可以用花錢擴大硬盤來處理。

1.2、主鍵

在應用mysql的innodb的時刻，innodb的底層存儲模子是B+樹，它應用主鍵作為聚簇索引，應用拔出的數據作為葉子節點，經由過程主鍵可以很快找到葉子節點，從而疾速獲得記載。是以在設計表的時刻須要增長一個主鍵，並且最好要自增。由於自增主鍵可讓拔出的數據按主鍵次序拔出究竟層的B+樹的葉子節點中，因為是順次的，這類拔出簡直不須要去挪動已有的其它數據，所以拔出效力很高。假如主鍵不是自增的，那末每次主鍵的值近似隨機，這時候候就有能夠須要挪動年夜量數據來包管B+樹的特征，增長了不用要的開支。

1.3、字段

1.3.1、建了索引的字段必需加上not null束縛，而且設置default值

1.3.2、不建議應用float、double來存小數，避免精度喪失，建議應用decimal

1.3.3、不建議應用Text/blob來保留年夜量數據，由於對年夜文本的讀寫會形成比擬年夜的I/O開支，同時占用mysql的緩存，高並發下會極年夜的下降數據庫的吞吐量，建議將年夜文本數據保留在專門的文件存儲體系中，mysql中只保留這個文件的拜訪地址，好比博客文章可以保留在文件中，mysql中只保留文件的絕對地址。

1.3.4、varchar類型長度建議不要跨越8K。

1.3.5、時光類型建議應用Datetime，不要應用timestamp，固然Datetime占用8個字節，而timestamp只占用4個字節，然則後者要包管非空，並且後者是對時區敏感的。

1.3.6、建議表中增長gmt_create和gmt_modified兩個字段，用來記載數據創立的修正時光。這兩個字段樹立的緣由是便利盤問題。

1.4、索引創立

1.4.1、這個階段因為對營業其實不懂得，所以盡可能不要自覺加索引，只為一些必定會用到索引的字段加通俗索引。

1.4.2、創立innodb單列索引的長度不要跨越767bytes，假如跨越會用前255bytes作為前綴索引

1.4.3、創立innodb組合索引的各列索引長度不要跨越767bytes，一共加起來不要跨越3072bytes

2、SQL優化

普通來講sql就那末幾種：根本的增刪改查，分頁查詢，規模查詢，隱約搜刮，多表銜接

2.1、根本查詢

普通查詢須要走索引，假如沒有索引建議修正查詢，把有索引的誰人字段加上，假如因為營業場景沒法應用這個字段，那末須要看這個查詢挪用量年夜不年夜，假如年夜，好比天天挪用10W+，這就須要新增索引，假如不年夜，好比天天挪用100+，則可以斟酌堅持原樣。別的，select * 盡可能罕用，用到甚麼字段就在sql語句中加甚麼，不用要的字段就別查了，糟蹋I/O和內存空間。

2.2、高效分頁

limit m,n其本質就是先履行limit m+n，然後從第m行取n行，如許當limit翻頁越往後翻m越年夜，機能越低。好比

select * from A limit 100000,10，這類sql語句的機能是很差的，建議改成上面的版本:

selec id,name,age from A where id >=(select id from A limit 100000,1) limit 10

2.3、規模查詢

規模查詢包含between、年夜於、小於和in。Mysql中的in查詢的前提稀有量的限制，若數目較小可以走索引查詢，若數目較年夜，就成了全表掃描了。而between、年夜於、小於等，這些查詢不會走索引，所以盡可能放在走索引的查詢前提以後。

2.4、隱約查詢like

應用 like %name%如許的語句是不會走索引的，相當於全表掃描，數據量小的時刻不會有太年夜的成績，數據量年夜了今後機能會降低的很凶猛，建議數據量年夜了今後應用搜刮引擎來取代這類隱約搜刮，其實不可也要在隱約查詢前加個能走索引的前提。

2.5、多表銜接

子查詢和join都可以完成在多張表之間取數據，然則子查詢機能較差，建議將子查詢改成join。關於mysql的join，它用的是Nested Loop Join算法，也就是經由過程前一個表查詢的成果集去後一個表中查詢，好比前一個表的成果集是100條數據，後一個表有10W數據，那末就須要在100*10W的數據聚集中去過濾獲得終究的成果集。是以，盡可能用小成果集的表去和年夜表做join，同時在join的字段上樹立索引，假如建不了索引，就須要設置足夠年夜的join buffer size。假如以上的技能都沒法處理join所帶來的機能降低的成績，那爽性就別用join了，將一次join查詢拆分紅兩次簡略查詢。別的，多表銜接盡可能不要跨越三張表，跨越三張表普通來講機能會很差，建議拆分sql。

3、數據庫銜接池優化

數據庫銜接池實質上是一種緩存，它是一種抗高並發的手腕。數據庫銜接池優化重要是對參數停止優化，普通我們應用DBCP銜接池，它的詳細參數以下：

3.1 initialSize

初始銜接數，這裡的初始指的是第一次getConnection的時刻，而不是運用啟動的時刻。初始值可以設置為並發量的汗青均勻值

3.2、minIdle

最小保存的余暇銜接數。DBCP會在後台開啟一個收受接管余暇銜接的線程，當該線程停止余暇銜接收受接管的時刻，會保存minIdle個銜接數。普通設置為5，並發量其實很小可以設置為1.

3.3、maxIdle

最年夜保存的余暇銜接數，依照營業並發岑嶺設置。好比並發岑嶺為20，那末當岑嶺曩昔後，這些銜接不會立時被收受接管，假如過一小段時光又來一個岑嶺，那末銜接池便可以復用這些余暇銜接而不須要頻仍創立和封閉銜接。

3.4、maxActive

最年夜活潑銜接數，依照可以接收的並發極值設置。好比單機並發量可接收的極值是100，那末這個maxActive設置成100後，就只能同時為100個要求辦事，過剩的要求會在最年夜期待時光以後被擯棄。這個值必需設置，可以避免歹意的並發進擊，掩護數據庫。

3.5、maxWait

獲得銜接的最年夜期待時光，建議設置的短一點，好比3s，如許可讓要求疾速掉敗，由於一個要求在期待獲得銜接的時刻，線程是弗成以被釋放的，而單機的線程並發量是無限的，假如這個時光設置的太長，好比網上建議的60s，那末這個線程在這60s內是沒法被釋放的，只需這類要求一多，運用的可用線程就少了，辦事就變得弗成用了。

3.6、minEvictableIdleTimeMillis

銜接堅持余暇而不被收受接管的時光，默許30分鐘。

3.7、validationQuery

用於檢測銜接能否有用的sql語句，普通是一條簡略的sql，建議設置

3.8、testOnBorrow

請求銜接的時刻對銜接停止檢測，不建議開啟，嚴重影響機能

3.9、testOnReturn

清償銜接的時刻對銜接停止檢測，不建議開啟，嚴重影響機能

3.10、testWhileIdle

開啟了今後，後台清算銜接的線程會沒隔一段時光對余暇銜接停止validateObject，假如銜接掉效則會停止消除，不影響機能，建議開啟

3.11、numTestsPerEvictionRun

代表每次檢討鏈接的數目，建議設置和maxActive一樣年夜，如許每次可以有用檢討一切的鏈接。

3.12、預熱銜接池

關於銜接池，建議在啟動運用的時刻停止預熱，在還未對外供給拜訪之進步行簡略的sql查詢，讓銜接池充斥需要的銜接數。

4、索引優化

當數據量增長到必定水平後，靠sql優化曾經沒法晉升機能了，這時候候就須要祭出年夜招：索引。索引有三級，普通來講控制這三級就足夠了，別的，關於樹立索引的字段，須要斟酌其選擇性。

4.1、一級索引

在where前面的前提上樹立索引，單列可以樹立通俗索引，多列則樹立組合索引。組合索引須要留意最左前綴准繩。

4.2、二級索引

假如有被order by或許group by用到的字段，則可以斟酌在這個字段上建索引，如許一來，因為索引自然有序，可以免order by和group by所帶來的排序，從而進步機能。

4.3、三級索引

假如下面兩招還不可，那末就把所查詢的字段也加上索引，這時候候就構成了所謂的索引籠罩，如許做可以削減一次I/O操作，由於mysql在查詢數據的時刻，是先查主鍵索引，然後依據主鍵索引去查通俗索引，然後依據通俗索引去查絕對應的記載。假如我們所須要的記載在通俗索引裡都有，那就不須要第三步了。固然，這類建索引的方法比擬極端，不合適普通場景。

4.4、索引的選擇性

在樹立索引的時刻，盡可能在選擇性高的字段上樹立。甚麼是選擇性高呢？所謂選擇性高就是經由過程這個字段查出來的數據量少，好比依照名字查一小我的信息，查出來的數據量普通會很少，而依照性別查則能夠會把數據庫一半的數據都查出來，所以，名字是一個選擇性高的字段，而性別是個選擇性低的字段。

5、汗青數據歸檔

當數據量到了一年增長500W條的時刻，索引也力所不及，這時候候普通的思緒都是斟酌分庫分表。假如營業沒有迸發式增加，然則數據切實其實在遲緩增長，則可以不斟酌分庫分表這類龐雜的技巧手腕，而是停止汗青數據歸檔。我們針對性命周期曾經結束的汗青數據，好比6個月之前的數據，停止歸檔。我們可使用quartz的調劑義務在清晨准時將6個月之前的數據查出來，然後存入長途的hbase辦事器。固然，我們也須要供給汗青數據的查詢接口，以備不時之需。

以上就是對mysql 單機數據庫的優化材料整頓，後續持續彌補相干材料，感謝年夜家對本站的支撐！

MySQL綜合教程