項目背景
隨著電力系統信息化建設的不斷推進,業務的快速發展,各種應用系統已陸續建成并投入使用,這些應用系統為電力行業的發展起著重要的作用。如何保證這些系統更加穩定可靠的長時間運行,是信息建設進程中的重中之重,而其中,維系整個業務系統生存的就是在系統中不斷產生、交換、變更地業務數據。保證業務系統的穩定也就成了保證業務系統中數據的安全和可靠。
在電力企業中,應用業務系統數量不多,主要有MIS系統、OA系統,計費系統等核心系統。MIS系統包括業務管理子系統、電費管理子系統、用電檢查子系統、計量管理子系統、用戶管理子系統;以上系統數據必須得到最安全的保證,一旦數據發生損壞或丟失,造成的后果將是不可估量。
需求分析
安徽定遠供電公司的服務器系統主要有9臺數據服務組成(6臺windows平臺的SQL服務器,2臺windows平臺的oracle服務器和一臺exchange服務器),目前對服務器的數據都未進行專業的數據備份保護,重要的數據也只是人工的備份操作,如定期刻光盤、拷貝到移動硬盤上等,一旦系統或者某一硬盤出現故障,將無法及時、可靠的恢復數據,甚至造成數據丟失,直接影響供電公司業務的正常運行,基于這種環境下,信息中心決定建設一套針對服務器數據的存儲備份恢復系統,來保證數據的安全和業務的持續運行。
DFT解決方案
如拓撲圖所示,定遠供電公司總計有9臺數據服務器需要進行數據備份保護,從數據的安全高效備份和未來擴展的角度考慮,DFT本次數據備份采用千兆IP網絡進行服務器群和備份設備之間的連通,做好了數據保護,就能夠及時的恢復業務系統,減少數據中心之間切換帶來的風險。
在不改變安徽定遠電力公司信息化系統結構的基礎上,本地增加一套DFT QuickBack災備設備,在無需購買額外備份軟件的情況下,QuickBack可以為整個信息化系統的所有系統、應用及數據提供全方位的災難備份恢復,確保了客戶應用環境、應用數據的可靠性,快照功能確保了信息化過程中的各種災難的歸避;DFT QuickBack可實現的RTO******不超過15分鐘;
二期在省電力信息數據中心增加一臺DFT QuickBack設備,可實現定遠QuickBack與省中心的數據同步,即使定遠整個機房發生站點級的故障(如發生地震、火災等),省中心可以在短時間內為定遠縣供電公司提供遠程數據恢復,或者直接在災備中心將所有應用、數據啟動起來,由省中心提供持續的業務服務。
一期可實現功能如下:
在數據中心使用的存儲系統本身能提供RAID保護機制,在一定程度上保證數據不丟失,但是這是在物理層面上,如果業務系統上出現邏輯錯誤造成數據丟失,則RAID保護機制就沒有辦法恢復這些數據。為此,我們在QuickBack配置了內部卷快照軟件――Snapshot,使用該軟件實現數據本地的數據保護,尤其是產生邏輯錯誤時,可以隨時對本地盤上的數據進行快速恢復。對于每個虛擬的邏輯卷,提供高達255個快照版本。隨時可以Mount出來進行數據讀寫。此外,還有Copy功能,將Snapshot拷貝出來,形成一個邏輯卷,進行讀寫。然后直接將Snapshot或者Snapshot拷貝出來的LUN通過iSCSI HBA卡或者FC HBA卡,派給業務服務器。這樣通過iSCSI/FC HBA卡直接讀取QuickBack中備份的系統盤及數據盤,啟動服務。
? 關于業務回遷
如果存儲/服務器發生災難,停止服務,在修復好服務器/存儲之后,我們可以立刻調用DFT QuickBack中的鏡像磁盤通過LAN直接進行數據恢復,由于鏡像磁盤與生產磁盤的數據是時時同步的,所以差異數據可以接近0,保證恢復出來的服務器是接近0數據丟失的。Recovery CD的Microscan功能可以保證恢復的有效性。因為Recovery CD自身具有一套操作系統(Linux或Windows),所以不需要先在損壞的服務器中安裝任何系統,直接可以啟動Recovery CD,調用系統備份磁盤進行恢復。
? 關于磁盤的恢復
在數據盤發生故障無法使用的情況下,可以即刻將DFT QuickBack中的備份卷派給主機使用,首先恢復業務,這一操作,大大減小了RTO與RPO,由于數據之前是時時備份的,故DFT QuickBack中備份卷的數據影像與主機是接近一致的,數據丟失接近于零,而業務恢復的時間也就是短短的手動換卷的時間。如果不幸的破損的數據同時同步到了DFT QuickBack中備份卷,使得備份卷也無法使用,這時候我們就可以啟動快照,Mount出快照到主機上,先恢復業務,在硬盤修復好之后,再恢復數據。
? 關于系統和應用的恢復
在災難來臨之后,系統也可能受到致命的錯誤,從而無法啟動,這時我們就可以使用Recovery CD來通過本地以太網絡恢復系統。Recovery CD本身內部裝有一套Linux/Windows操作系統和iSCSI驅動,通過光驅啟動服務器后,可以讀取Recovery CD中的系統,再為系統配置IP地址后就能夠通過iSCSI協議調取DFT QuickBack中備份的系統盤影像及其快照。Recovery CD使用了MicroScan技術,使得系統恢復的速度大大提高??煺盏膫浞菔沟眉词乖趥浞萦跋穸荚P系統的影像的情況下,調用若干天前的較好的備份影像來恢復。
實施效果
?·24x7持續保護應用服務器
透過應用服務器端的磁盤保護工具,定遠供電公司所有系統和資料將得到及時監聽,在幾乎不影響應用程序運作的情況下記錄磁盤區塊新增異動,并依照管理者設定的保護原則,將差異的磁盤區塊持續或定時排程的復制到QuickBack儲存服務器,接著運用Snapshot快照技術,保存多達255個不同時間點的磁盤復本,無論應用服務器的系統當機、資料損毀或是硬體故障,都可以利用磁盤復本在最短的時間內復原至正常狀態。
?·立即檢視、隨時驗證的備份還原
傳統備份機制只能從備份紀錄中確認工作執行完畢,卻不代表資料已被正確保護, 且回復失敗的可能性很高。 DFT QuickBack在應用服務器端就能快速轉換快照磁盤復本并檢視內容,透過iSCSI及或Fibre Channel與應用服務器連結,1分鐘內就能直接載入檔案系統進行資料比對和還原驗證,完全不需長時間的資料回復,或占用服務器本身的磁盤空間,影響系統運作。
?·100%保證資料庫回復一致性
應用服務器的資料庫在執行快照時為了確?;貜唾Y料一致性,必須暫時停止運作。 DFT QuickBack特別針對所有主流的資料庫、應用程序,提供應用感知(Application-aware)的資料庫代理程序(DB agent),當資料庫接收到快照通知時,代理程序會自動執行記憶體資料寫入磁盤,快照后重啟資料庫等動作,不需撰寫Script,就能100%確保快照備份時資料庫的一致性,而且執行時資料庫只會暫停一瞬間,完全不影響日常營運。
?·5分鐘復原作業系統,關鍵應用不中斷
惡意程序破壞、更新程序沖突、硬盤故障等狀況都可能導致作業系統不穩或當機, 傳統備份機制需要冗長的程序才能回復正常運作。透過DFT QuickBack的Remote Boot 遠端啟動機制,可以在意外發生后,指定最后或特定時間點的快照復本磁盤,在應用伺服器重新開機后接手本機硬盤,5分鐘內就能恢復系統正常運作,完全不需重新安裝作業系統和回存資料,將停機造成的損失降至最低。
?·10分鐘復原服務器/儲存設備,節省硬體支出
應用服務器隨時可能因某個硬體組件故障造成停機,傳統的空機備援方式不僅耗時 費力,更有兼容性的疑慮;建置高可用性叢集(HA/Cluster)不僅成本昂貴,管理更 是一大負擔。 DFT QuickBack結合虛擬服務器(如VMware、Hyper-V)作為應用伺服 器的復原平臺,透過P2V復原機制(physical to virtual recovery),將快照磁盤復本直 接指派給虛擬機器(virtual machine)使用,不需冗長的檔案系統轉換程序,不需考 慮硬體與驅動程序兼容性,不用準備相同型號的備援服務器,10分鐘內就能在虛擬 服務器上啟動虛擬的備援服務器,快速恢復服務。相較于傳統備援機制,可節省硬體的采購與維護成本。