最近業務試水電商,接了一個秒殺的活。之前經常看到淘寶的同行們討論秒殺,討論電商,這次終於輪到我們自己理論結合實際一次了。
ps:進入正文前先說一點個人感受,之前看淘寶的ppt感覺都懂了,等到自己出解決方案的時候發現還是有很多想不到的地方其實都沒懂,再次驗證了“細節是魔鬼”的理論。並且一個人的能力有限,只有大家一起討論才能想的更周全,更細致。好了,閒話少說,下面進入正文。
秒殺或搶購活動一般會經過【預約】【搶訂單】【支付】這3個大環節,而其中【搶訂單】這個環節是最考驗業務提供方的抗壓能力的。
搶訂單環節一般會帶來2個問題:
1、高並發
比較火熱的秒殺在線人數都是10w起的,如此之高的在線人數對於網站架構從前到後都是一種考驗。
2、超賣
任何商品都會有數量上限,如何避免成功下訂單買到商品的人數不超過商品數量的上限,這是每個搶購活動都要面臨的難題。
二、如何解決?
首先,產品解決方案我們就不予討論了。我們只討論技術解決方案
1、前端
面對高並發的搶購活動,前端常用的三板斧是【擴容】【靜態化】【限流】
A:擴容
加機器,這是最簡單的方法,通過增加前端池的整體承載量來抗峰值。
B:靜態化
將活動頁面上的所有可以靜態的元素全部靜態化,並盡量減少動態元素。通過CDN來抗峰值。
C:限流
一般都會采用IP級別的限流,即針對某一個IP,限制單位時間內發起請求數量。
或者活動入口的時候增加游戲或者問題環節進行消峰操作。
D:有損服務
最後一招,在接近前端池承載能力的水位上限的時候,隨機拒絕部分請求來保護活動整體的可用性。
2、後端
那麼後端的數據庫在高並發和超賣下會遇到什麼問題呢?主要會有如下3個問題:(主要討論寫的問題,讀的問題通過增加cache可以很容易的解決)
I: 首先MySQL自身對於高並發的處理性能就會出現問題,一般來說,MySQL的處理性能會隨著並發thread上升而上升,但是到了一定的並發度之後會出現明顯的拐點,之後一路下降,最終甚至會比單thread的性能還要差。
II: 其次,超賣的根結在於減庫存操作是一個事務操作,需要先select,然後insert,最後update -1。最後這個-1操作是不能出現負數的,但是當多用戶在有庫存的情況下並發操作,出現負數這是無法避免的。
III:最後,當減庫存和高並發碰到一起的時候,由於操作的庫存數目在同一行,就會出現爭搶InnoDB行鎖的問題,導致出現互相等待甚至死鎖,從而大大降低MySQL的處理性能,最終導致前端頁面出現超時異常。
針對上述問題,如何解決呢? 我們先看眼淘寶的高大上解決方案:
I: 關閉死鎖檢測,提高並發處理性能。
II:修改源代碼,將排隊提到進入引擎層前,降低引擎層面的並發度。
III:組提交,降低server和引擎的交互次數,降低IO消耗。
以上內容可以參考丁奇在DTCC2013上分享的《秒殺場景下MySQL的低效》一文。在文中所有優化都使用後,TPS在高並發下,從原始的150飙升到8.5w,提升近566倍,非常嚇人!!!
不過結合我們的實際,改源碼這種高大上的解決方案顯然有那麼一點不切實際。於是小伙伴們需要討論出一種適合我們實際情況的解決方案。以下就是我們討論的解決方案:
首先設定一個前提,為了防止超賣現象,所有減庫存操作都需要進行一次減後檢查,保證減完不能等於負數。(由於MySQL事務的特性,這種方法只能降低超賣的數量,但是不可能完全避免超賣)
xx (x ) ;
解決方案1:
將存庫從MySQL前移到Redis中,所有的寫操作放到內存中,由於Redis中不存在鎖故不會出現互相等待,並且由於Redis的寫性能和讀性能都遠高於MySQL,這就解決了高並發下的性能問題。然後通過隊列等異步手段,將變化的數據異步寫入到DB中。
優點:解決性能問題
缺點:沒有解決超賣問題,同時由於異步寫入DB,存在某一時刻DB和Redis中數據不一致的風險。
解決方案2:
引入隊列,然後將所有寫DB操作在單隊列中排隊,完全串行處理。當達到庫存閥值的時候就不在消費隊列,並關閉購買功能。這就解決了超賣問題。
優點:解決超賣問題,略微提升性能。
缺點:性能受限於隊列處理機處理性能和DB的寫入性能中最短的那個,另外多商品同時搶購的時候需要准備多條隊列。
解決方案3:
將寫操作前移到MC中,同時利用MC的輕量級的鎖機制CAS來實現減庫存操作。
優點:讀寫在內存中,操作性能快,引入輕量級鎖之後可以保證同一時刻只有一個寫入成功,解決減庫存問題。
缺點:沒有實測,基於CAS的特性不知道高並發下是否會出現大量更新失敗?不過加鎖之後肯定對並發性能會有影響。
解決方案4:
將提交操作變成兩段式,先申請後確認。然後利用Redis的原子自增操作(相比較MySQL的自增來說沒有空洞),同時利用Redis的事務特性來發號,保證拿到小於等於庫存閥值的號的人都可以成功提交訂單。然後數據異步更新到DB中。
優點:解決超賣問題,庫存讀寫都在內存中,故同時解決性能問題。
缺點:由於異步寫入DB,可能存在數據不一致。另可能存在少買,也就是如果拿到號的人不真正下訂單,可能庫存減為0,但是訂單數並沒有達到庫存閥值。
三、總結
四、非技術感想
1、團隊的力量是無窮的,各種各樣的解決方案(先不談可行性)都是在小伙伴們七嘴八舌中討論出來的。我們需要讓所有人都發出自己的聲音,不要著急去否定。
2、優化需要從整體層面去思考,不要只糾結於自己負責的部分,如果只盯著一個點思考,最後很可能就走進死胡同中了。
3、有很多東西以為讀過了就懂了,其實不然。依然還是需要實踐,否則別人的知識永遠不可能變成自己的。
4、多思考為什麼,會發生什麼,不要想當然。只有這樣才能深入進去,而不是留在表面。
ps:以上僅僅是我們討論的一些方案設想,歡迎大家一起討論各種可行方案。