數(shù)據中心工作人員和業(yè)務相關人員花了很多時間和精力在到制定和測試災難恢復腳本上。
首先,預測潛在的數(shù)據中心災難:災害性天氣,停電,供應商系統(tǒng)脫機,內部人員的破壞或外部攻擊都是有可能的。
確定公司的災難恢復應用程序要立即在線。審核清單和優(yōu)先考慮日常運作的重點程序。
接下來, 原始資料和安裝冗余數(shù)據中心基礎設施——服務器、軟件、網絡連接、支持應用程序的載體,。災難恢復計劃無法避免成本考慮;一個離線數(shù)據中心是昂貴的。
通常, 災難恢復計劃要求復制每個應用程序的基礎設施組件。此外, 災難恢復需要和主備份站點網絡連接,給備份系統(tǒng)當前的軟件信息。
適當?shù)墓ぷ魅藛T需要了解如何調用備份進程。他將決定哪些系統(tǒng)使用和哪些員工應該更換系統(tǒng)備份。災難恢復的職責包括通知他們的網絡和系統(tǒng)提供商更改的數(shù)據和確保員工知道如何恢復系統(tǒng)。理想情況下,業(yè)務用戶只是略有影響。IT團隊需要在災難恢復數(shù)據期間提供新的備份資料程序給工作人員。
IT部門經?;ê芏鄷r間在設計和分析物理災難恢復計算環(huán)境上,而不是把時間用在編碼和測試中增加價值。測試一個災難恢復計劃,數(shù)據中心團隊要和相關的操作系統(tǒng)和所有新的補丁一起測試需要,接收、框架、堆疊和安裝硬件。他們創(chuàng)建災難恢復用戶帳戶,部署框架或應用程序服務器環(huán)境和安裝測試工具。程序員可以花一半的時間在普通的災難恢復基礎設施問題上,而不是把時間用在實際的測試程序。
因為災難恢復過程復雜,企業(yè)通常一年一次或兩次進行測試偶發(fā)性的災難恢復計劃。公司越大,對災難恢復計劃證明過程越復雜。
一旦災難恢復程序進入計劃,他們很快變成過時。應用不斷變化,因此團隊必須在經常審查和更新災難恢復程序。大公司在計劃的每個細節(jié)上花費員工眾多的時間和高達7位數(shù)以上的金錢($1,000,000+)。災難恢復花費更多以確保計劃仍然是可行的。
許多企業(yè)只是口頭上承認災難恢復。在IT投資上,花大量的時間來緩解這1%,甚至更低的災難恢復風險似乎并不是個好的投資。IT經理有一份又長又不斷增長的日常優(yōu)先清單,而當災難發(fā)生時,災難恢復是重要的事。