容災系統是指在遙遠的地方建立兩套或多套功能相同的IT系統,可以監控健康狀態,並在它們之間進行功能切換。當壹個系統因事故(如火災、地震)停止工作時,整個應用系統可以切換到另壹個地方,使系統功能繼續正常工作。
指示器:
1,RPO(恢復點目標):即數據恢復點目標,主要指業務系統可以容忍的數據丟失量。
2.RTO(Recovery Time Objective):即恢復時間目標,主要指業務可以停止服務的最長時間,即從災難發生到業務系統恢復服務功能的最短時間段。
技術:容災備份系統的建立會涉及到很多技術,如SAN或NAS技術、遠程鏡像技術、基於IP的SAN互聯技術、快照技術等。
擴展數據
根據容災系統對應用系統的保護程度,可分為數據級容災、應用級容災和業務級容災。數據級容災只是將生產中心的數據復制到容災中心。當生產中心出現故障時,只能實現存儲系統的接管或數據的恢復。
容災中心的數據可以是本地生產數據的完整拷貝(壹般實現同城),也可以稍微落後於生產數據,但必須可用(壹般實現異地)。
然而,不同的數據通常可以通過壹些工具(如操作記錄和日誌)來手動彌補。基於數據容災的業務恢復速度較慢,通常RTO超過24小時,但該級別容災系統的運維成本較低。
應用級容災是在數據級容災的基礎上,進壹步實現應用可用性,保證業務快速恢復。這就要求容災系統的應用不能改變原有的業務處理邏輯,是生產中心系統的基本拷貝。
因此,容災中心需要建立壹個相當於本地生產的備份環境,包括主機、網絡、應用、IP等資源。當生產系統發生災難時,遠程系統可以提供完全可用的生產環境。應用級容災的RTO通常在12小時以內,技術復雜度高,運維成本高。
業務級容災是生產中心和容災中心同時處理業務請求的壹種容災方式,可以保證業務的連續可用。這樣業務恢復流程高度自動化,30分鐘內即可實現RTO。
但這種容災項目實施難度較大,需要從應用層對系統進行改造,更適合流程固定的簡單業務系統。這種容災系統的運維成本最高。
百度百科-容災