IBM 存儲解決方案:電子商務的選擇(1)

  為什麼您需要災難恢復計畫?

  當企業越來越依賴於數據去進行處理它的商業行為以及由此來保證它在業界的競爭力的時候,數據處理的高可靠性和高可用性就尤為關鍵。一個計算機系統的長期停止將直接導致明顯的財務流失,更為重要的是,您將失去客戶的信任以及一系列的企業賴以生存發展的市場,在一些情況下,數據的丟失甚至將會導致整個企業的失敗。



據一項美國的研究報告顯示,在災害之後,如果無法在 21 天內恢復資訊作業,有 75% 的公司業務會完全停頓,43% 的公司再也無法重新開業,因而有 20% 的企業在兩年之內被迫宣告破產。美國 minnesota 大學的研究表明,遭遇災難的同時又沒有災難恢復計畫的企業,超過 60% 以上企業在的兩到三年後將退出市場,隨著企業對數據處理依賴程度的遞增,此比例還有上升的趨勢。因此,在限定的時間內成功的災難恢復將應該是一個企業戰略計畫中的一個關鍵組成部分。



ibm s/390 業務恢復存儲解決方案



由於套用的可用性和災難恢復能力越來越被看重,越來越多的公司開始採用雙站點策略。ibm 被稱為地理分散並行系統(geographically dispersed parallel sysplex ,gdps)的 s/390 多站點套用可用性解決方案,將 s/390 並行 sysplex 技術與遠程拷貝技術集成在一起,能夠提高套用的可用性和災難恢復能力。



ibm 的存儲系統部在 1994 年推出了兩種遠程拷貝功能,一種被稱為 pprc(peer-to-peer remote copy,對等遠程拷貝),一種被稱為 xrc(extended remote copy,擴展遠程拷貝),並在 1995 年投入套用。1996 年,所有 ibm 3990 存儲控制家族產品的先前型號都被具有遠程拷貝功能的型號6替代。



對等遠程拷貝(pprc)功能現在被所有主要的 s/390 存儲供應商視為 s/390 sysplex 災難恢復領域的前途所在。pprc 和增強 os/390 以及地理分散並行 sysplex (gdps) 一道,成為業界高可用性解決方案的領導者。最近的 gartner 分析表明,並行 sysplex 解決方案每年平均停機時間少於 10 分鐘。



gdps 是一種多站點套用可用性解決方案,具有管理遠程拷貝配置和存儲子系統、自動執行並行 sysplex 操作任務、從單一控制點執行故障恢復等功能,從而達到了提高套用可用性的目的。通過 gdps 和 pprc,ibm 使災難發生後進行恢復的時間縮減到以分鐘計算。



除非特殊說明,下文敘述的所有解決方案都假設主站點和恢復站點之間通過企業系統連線(escon)一類的寬頻連線互連。



備份和恢復



在所有的 it資 源中,數據最重要,但也最不穩定最複雜。其他資源,如處理能力、供應商提供的軟體、dasd、存儲設備、建築物等,都是最終可替換的,但大部分數據卻是不可替換的。而數據對商業活動來說是最重要的。在這裡我們將討論適用於災難恢復的不同 ibm 產品,它們能夠進行不同類型的數據管理,設定不同的數據備份選項。本部分主要敘述用於災難恢復的功能,但並沒有覆蓋這些產品所有的可用功能。



遠程拷貝



當某一套用站點停機時,ibm 的遠程拷貝功能能夠進行快速有效的災難恢復。該功能能夠在遠程站點實時維護數據的鏡像拷貝,並確保以與主站點完全相同的次序在遠程站點進行數據寫入更新的遠程複製。這一解決方案在遠程拷貝控制機制下自動對 dasd 卷上的數據進行跟蹤。這種跟蹤的發生獨立於使用這些數據的套用。因此,來自不同套用的獨立遠程拷貝功能是不需要的。



套用的性能保護、數據當前值選項和數據獨立都是 ibm 遠程拷貝設計中的組成部分。遠程拷貝方法有以下不同的兩種:



對等遠程拷貝(pprc)



擴展遠程拷貝(xrc)



pprc 和 xrc 都試圖通過維護 dsad 卷間的實時拷貝來達到數據保護的目的。遠程拷貝超出了狹隘意義上的雙重拷貝,因為它允許副卷存儲在遠地點上。雙重拷貝的主要用途是保護數據不受設備失效的損害,而遠程拷貝的目的要更加廣泛。



對等遠程拷貝 (pprc)



pprc 提供的災難恢復能夠最大限度地保留數據當前值。如果您屬於以下的情況,pprc 將能夠很好地適合您的需要:



避免數據丟失是您最優先的考慮



您的運行站點和恢復站點之間的距離不超過 103 公里



您的工作負載和要求能夠承受同步拷貝帶來的性能損失



pprc 提供有助於保留數據當前值和完整性的兩類選擇。一個選擇是將卷標記為"關鍵",保證在副卷不能更新時,原有的更新也將無效,不論卷是處於同步狀態還是非同步狀態,甚至是在災難出現時也如此。這一功能通過 apar 提供,在寫入時被設定為可用。

第二個選擇是使用最近被改進的系統錯誤恢復程式(error recovery procedure,erp)。當發生問題時,erp 在向主機返回完成狀態之前記錄錯誤信息,在遠程站點上將配置這些記錄的一個拷貝,從而即使在災難過程中也能夠連續提供哪些卷處於同步狀態和哪些卷沒有處於同步狀態這樣的信息,這一功能通過 apar 提供。



pprc 對於 vse 用戶來說也是一種理想的災難恢復解決方案選擇。通過使用 ickdsf 命令接口可以很容易地建立 pprc 路徑和 pprc 對。vse 環境下的 pprc 功能與 os/390 環境下類似,只是 vse 用戶使用 ickdsf 命令接口而 os/390 用戶使用 tso/e 命令接口。



os/390 環境下運行的 pprc 還能夠與一種被稱為對等動態地址交換(peer-to-peer dynamic address switching ,p/das) 的新功能共同工作。p/das 實現的技術使套用系統能夠在不損害 pprc 用於副卷訪問的嚴格數據完整性標準的情況下,不必通過套用的中止和重啟動就可以訪問副卷。此外,p/das 在預期將發生負載轉移和子系統維護時能夠促進 pprc 跟蹤方向的自動反轉。

  在以前的 p/das 實現方法中,swap 命令的第一地址是在一個 pprc 主卷上,第二地址在相應的副卷上。在 ess 系統中將不再要求這兩個卷構成一個活動 pprc 對,您可以交換 ess 系統中的任意卷對,前提是必須能夠確保所交換的卷是一致的。