關於異地容災的感觸
1、使用N個節點,容M個。比如3個節點,每個節點冗余50%,可以承受一個節點down掉;
2、要經常演練。比如1個月1次主動切換,要不真正出問題的時候,一個小時都在猶豫不決能不能切換,評估周期太長;
3、節點間盡量同構。否則節點間同步非常痛苦;
4、要保證節點間全同步。比如沒有同步Cache,一個節點down掉,切換過去後cache全部打穿,原來假設的冗余根本無法支撐,導致全部down掉;
5、降級要准備好。你所假設的冗余是理想真空環境,只在理論上存在,一定要准備好降級手段。
另外昨天跟一個張老師交流的感悟,一塊記錄一下:
1、所有的技術規范和要求都是扯淡的,你要通過技術手段轉換成可執行的東西,比如抽象成統一的安全接入服務、統一的加解密lib庫、統一的入參校驗庫等等
2、讓不同的人寫不同的代碼,技術骨干要寫上面的CBB的東西,普通技術人員寫其他的業務邏輯