飓風卡特裡娜,飓風麗塔,這些破壞力極大的事件(這只是 2005 年 27 起有名字的風暴和 14 起飓風中的 2 起)給整個美國敲響了警鐘,也讓人們清醒地認識到,如果沒有謹慎的計劃,企業的運營是多麼的脆弱。
有些緊急事件(例如飓風)是有預兆的,而另一些災難(例如恐怖活動、爆炸、地震、計算機病毒或人體病毒)則往往突然襲來。
為了為這些潛在的危險做准備,企業逐漸加大業務連續性計劃(business continuity planning,BCP)方面的投入。確保對關鍵文檔和記錄(通常存儲在企業內容管理系統中)的訪問,是任何 BCP 的重要組成部分。
BCP 的定義
業務連續性協會(Business Continuity Institute)將 BCP 定義為 “識別潛在損失的影響所必需的事先計劃和准備;制定和實施可行恢復策略;開發恢復計劃,以確保當事件、事故或危機(E/I/C)發生時企業服務的連續性,並交付完善的訓練、測試和維護計劃。” 換句話說,BCP 是評估因嚴重的、計劃外的事件而引起的業務風險,並為在事故發生時確保關鍵運營的連續性做准備的過程。
BCP 不僅涉及硬件、軟件和數據;實際上,它應該包含對於保持業務連續運營有關鍵意義的一切東西。對於任何行業,BCP 都可以劃分成以下幾個類別:
工作場所,包括在事故期間可能遭到破壞的所有物理建築(辦公樓、商店、總部、工作站等)。
技術,除了相關的關鍵應用(例如為任何有計劃的冗余給予許可)之外,還包括存儲在已有硬件和軟件中的實在的信息(通常由本地故障轉移和標准災難恢復計劃來恢復)。
人員,確保被調動的人能繼續他們最初的業務功能。
市場相互作用,確保企業在危機期間能得到每個分部和第三方供應商的支援。
構建業務連續性計劃是一個復雜的行為。業務連續性協會建議將 BCP 分為十要素:
1. 啟動和管理。企業需要什麼?誰將對業務連續性負責?
2. 業務影響分析。什麼業務功能是真正關鍵的?
3. 風險評估和控制。什麼事件對業務有影響,如何緩和這些事件?
4. 業務連續性策略的開發。什麼是業務連續性解決方案?如何交付業務連續性解決方案?業務連續性解決方案如何減少和防止業務上的損失?
5. 緊急響應和操作。應該建立什麼樣的程序和小組/中心來處理緊急事件?
6. BCP 的開發和實施。為了更好地保護業務,需要哪些東西?
7. 意識和訓練。如何確保每個人在發生緊急事件時都清楚自己的職責和任務?
8. 維護和計劃練習。每隔多長時間對計劃進行檢查和驗證?
9. 危機傳達。如何將 BCP 計劃傳達給內部和外部的風險承擔者?
10. 外部代理協調。如何與第三方供應商交流,確保外部業務供應鏈的連續性?
企業必須在全體和業務組兩個級別上發起、理解、制定、嵌入和批准 BCP,從而做好充分准備,減少風險。
注意,BCP 不同於災難恢復計劃。數據中心的災難恢復計劃用於進行本地故障轉移,實際上只是在 IT 基礎設施中保留冗余,避免硬件和基礎設施之外的損失。
內容管理中的 BCP
在很多企業中,都有一個企業內容管理系統來存儲關鍵信息,例如法律文檔、合同、記錄、工程制圖、租借信息和其他關鍵信息。
我將根據前面列出的四種類別,講解用於內容管理的 BCP。
工作場所。BCP 在工作場所中的目的是確保業務關鍵功能在兩個地點之間是完全 “可熱切換的(hot-swappable)”。這一步需要一個鏡像的 “迷你” 生產辦公環境。當准備鏡像的生產環境時,需要確保完整而獨立的自治性。換句話說,需要復制辦公設施中應有的所有組成部分(電力、空間、家具等等)。
這些考慮看上去簡單。然而,鏡像的地點必須隨時可用,並應配有最基本的家具,能照顧其他三類。
技術。對於鏡像的生產環境,當考慮技術時,務必小心地分析、設計和測試從當前基礎設施轉移生產內容和數據的方法。轉移方法應該對當前生產運營透明,包括對最近創建的所有關鍵數據的備份,並應該盡可能自治。另外還必須監控和測試數字基礎設施的自治性。
一個典型的內容管理環境包括服務器、客戶機、網絡(路由器、線纜、電力等等),它們一起存在於一個群集中心或辦公樓內。在典型的大型業務連續性計劃中,這些要素在另一個地方被完全復制,雖然這個地方在規模上要小一些。復制包括所有的硬件和軟件組成部分,所以必須維持定期的增量刷新同步。
根據負責的企業所有者的需求,這種增量刷新可能只覆蓋內容管理系統的特定部分(例如,只有存放規章內容的倉庫),也可能涵蓋企業內的所有內容管理系統。
有很多方法來實現這種復制:包括網絡附加存儲(例如 IBM System Storage)、存儲區域網絡(例如 IBM Total Storage)在內的傳統備份系統,或者針對中小型企業的備份系統(例如 IBM Tivoli)。
在大多數情況下,公司會備份整個內容管理系統,包括內容、訪問控制列表、對象模型、文件夾結構(分類法)、權限設置、應用服務器、Web 服務器和任何定制或附件。
在大型企業中,為了在恢復過程中能取得更大的合力和一致性,復制所有內容管理系統中的公共組件非常重要。對於有共同支持主題的數據中心中的內容管理系統,也是如此。
確保用於保證業務連續性的所有軟件都具有所需的許可,包括內容管理軟件和任何 Web 服務器、應用服務器、數據庫服務器和系統/網絡監控軟件的許可。
人員。在災難計劃中,人員因素往往遭到忽視。然而,在危機期間有適當的人來支持內容管理(以及其他任何)系統是非常重要的。應該對人員下達簡令,明確他們的職責,告訴他們在事故期間會發生什麼事情。為保證連續性,常常需要重新將那些人(以及他們的家庭)安置到鏡像生產環境附近的一個地方。
任何企業中都存在著人員的流動,所以應該定期監控和更新名單。當然,將這種監控自動化要困難得多,因為確定適當的接替者需要人為的決策。
仍然有很多事件可以作為自動化的觸發器,包括雇員 ID 的撤銷或離職核查清單。這些事件將導致 BCP 監控系統收到一個通知,並將通知發送到適當的 BCP 代表,從而根據必要的訪問級別驗證新的接替者。BCP 監控系統通常是根據鏡像環境打造的當前監控系統(例如 LDAP 監控)的復制品。
市場相互影響。在事件發生之後,最困難的是確保 BCP 計劃的所有關鍵部分不脫節。這要求對整個過程中的業務慣例做更深入的分析和調查。BCP 活動與其他業務供應商之間的交流必不可少。
為保證企業內全部業務的連續性,識別、設計和測試不同單位之間的互連性是最基本的要求。這包括確定每個獨立業務單位中的負責人,以及確保在危機期間所有必需的內容能被輸送給適當的人。
未雨綢缪
20 世紀 90 年代在德克薩斯大學進行的一項研究發現,在經歷過一場災難的企業當中,有 43% 的企業未能重新開業,有 29% 的企業兩年內關門大吉。當為關鍵內容管理系統考慮 BCP 策略時,不要妄想走捷徑,或者尋找暫且應急的解決方案。BCP 是財富 500 強公司的必需品,小型企業也是一樣。一年前新奧爾良的悲劇告訴我們,沒有企業能幸免於難。不要讓您的企業成為歷史。