DFT容災備份系統解決方案
—— DFT 解決方案部
引言
當今的世界,正在跨入信息時代,數據和信息逐漸成為各行各業的業務基礎和命脈。當企業因為信息化帶來快捷的服務決策和方便管理時,也必須面對著數據丟失的危險,數據的重要性已經得到了人們的充分認識。
2001年9月11日,美國世貿中心雙子大廈遭受了嚴重的恐怖襲擊。在這兩棟大樓中,共有1200家公司,其中僅400家公司執行了災難恢復預案,而大多數公司因為沒有建立災難恢復系統,數據損毀、丟失,導致業務無法恢復,最后只能宣布倒閉。
據美國德克薩斯州大學的調查顯示:只有6%的公司可以在數據丟失后生存下來,43%的公司會徹底關門,51%的公司會在兩年之內消失。
隨著信息系統逐步上升為企業生產運行的中樞,保障信息系統的安全、穩定成為保證企業生產持續運行的關鍵。因此,為企業的信息系統建立起有效的備份與容災體系,在發生各類災難時快速響應、全力保證業務連續性,成為企業當前及未來IT建設的重點。
有了備份還需要容災嗎?
通常,備份包括數據備份、應用備份、線路備份等,把一份數據復制到另一存儲介質時,就是一種備份,給數據傳輸提供一條以上的傳輸鏈路也是一種備份,但這僅僅是備份,不是容災??梢哉f,容災是備份的最高境界,但備份并不算是容災的一種方式。容災與備份到底有著怎樣的關系,深圳迪菲科技有限公司(以下簡稱DFT)從以下幾點做出比較:
1. 容災與備份的目的不同
容災系統的目的在于保證生產系統數據以及業務的連續性,即當生產系統發生故障時,仍然能夠保證數據的完整性以及業務可以繼續提供服務,以使系統不致停頓。
而備份技術的目的與此并不相同,備份是側重于數據的安全性和記錄過程,其目的在于預防系統數據中的邏輯錯誤和歷史數據保存。
2. 備份是數據保護的基礎
備份是指為防止生產系統出現操作失誤或生產系統故障導致數據丟失,而將全系統或部分數據集合從應用主機的硬盤或陣列定期存放到其它的存儲介質的過程。
備份是數據高可用的最后一道防線,它保存了生產數據的一個或者多個完整的副本,其目的是為了生產系統數據崩潰時能夠恢復數據。
3. 容災是業務連續保護的基石
那么建設了備份系統,是否就不需要容災系統?下圖是DFT從故障部件及預期恢復時間來分析,當郵箱數據丟失、數據庫崩潰、應用系統、操作系統或存儲單元故障時,再甚至是RAID故障、服務器故障等這些故障都可以通過磁盤備份、磁帶備份或雙機熱等備份或冗余的方式來實現數據的容錯性,但是,這樣只能夠滿足數據丟失、數據破壞時的數據恢復目的,而不能提供實時的業務接管功能。當業務部門對RTO(恢復所需的時間指標)/RPO(能夠恢復到的最新狀態)指標的期望值,如果允許1TB的數據庫RTO=8小時,RPO=1天,那備份系統就能滿足要求。但是,當企業的數據容量達到TB級或更多時,且業務對數據的恢復指標的期望值較高時;當數據中心遭遇災難時,如發生自然災害(地震、洪水、火災等)、人為損失(誤操作、病毒、黑客等)時,那么容災建設就是企業的必修課。
容災系統對于某些關鍵業務而言也是必不可少的。其實容災就是針對當生產站點的業務系統不能正常工作時,其業務可由容災站點接替這些業務,保持業務的連續性,能夠提供很好的RTO和RPO指標;同時遠程容災站點具備應付各種災難,特別是區域性與毀滅性災難的能力,具備較為完善的數據保護與災難恢復功能,保證災難降臨時數據的完整性及業務的連續性,并在最短時間內恢復業務系統的正常運行,將損失降到最小。
DFT容災備份解決方案
據DFT調查統計,在國內中大型企業中,目前有58%的企業為保證關鍵業務系統的持續運行,關鍵應用系統采用了雙機熱備,數據集中存儲,并且對重要數據實現了備份,35%的企業仍未更新硬件,采用單獨的應用系統和存儲系統,數據沒有得到統一的管理和存儲,只有7%的企業建立的容災系統。也就是說,有93%企業在遇到下列問題時會對企業的業務造成影響甚至關系到企業的存亡:
1. 單獨的應用系統和存儲系統最為脆弱,在遇到某臺服務器硬件或軟件故障時,業務即停直到故障修復,無法修復則無法運行;
2. 雙機熱備能提高業務的連續性,存儲系統仍存在單點故障,當存儲系統出現故障時,所有接入存儲的服務器上的業務都將中斷,另從備份系統中調取數據,這中間可能需要花費數小時或數天時間;
3. 沒有做雙機熱備的服務器在系統或硬件故障時,應用將不得不長時間停機,直到系統恢復或硬件更換結束;
4. 數據遭遇人為破壞(如,病毒)及自然災害(如火災、地震等)時,由于沒有遠程容災系統,業務應用將中斷,甚至所有數據都可能全部丟失。
為保證數據安全及應用業務持續運行,搭建DFT QuickBack容災系統,對人為錯誤、硬件故障或自然災害引起的數據丟失,業務宕機等問題提供一套完整的解決方案,對機房本地和異地服務器的數據和系統做全面保護。當主機宕機后,災備系統可以立即啟動,接管其原來的業務,保證業務數據的安全性,確保業務系統持續運行。
DFT 容災備份方案的架構方式
DFT QuickBack備份/容災一體化解決方案的核心,都是通過DFT QuickBack管理器來實現各層次的備份與容災。DFT QuickBack支持多種架構方式:Side-Band方式、In-Band方式、SANTap數據分流方式、遠程File Agent/Disk Agent方式。用戶可以任選一種部署,也可以同時部署多種,從而獲得******的備份與容災效果。
1. 遠程File Agent/Disk Agent方式
通過DFT公司的客戶端軟件File Agent或Disk Agent將生產主機的生產數據直接傳輸到遠程的DFT QuickBack管理器上,實現遠程災難備份。DFT的File Agent用于基于文件級的遠程災難備份,而Disk Agent則用于基于塊級和操作系統的遠程災難備份。
2. Side-Band旁路方式
DFT QuickBack以Side-Band旁路的方式接入到生產系統中,DFT QuickBack采用內置的存儲空間或外接的各類開放式存儲設備,為生產和辦公環境提供智能化極高的實時數據獲取和瞬間故障恢復能力。這種方式基本不改動現有生產系統的結構,只是通過SAN或LAN將生產數據采用不同的鏡像方式提取到DFT QuickBack中,DFT QuickBack可以對鏡像過來的數據提供各種存儲服務尤其是災難恢復服務和數據提取與分析服務。利用部署在遠程備份中心的QuickBack管理器,就實現了本地和異地均具備的瞬間災難恢復能力。
DFT QuickBack的容災技術
1. 多時間點自動連續快照技術
Snapshot多時間點的自動連續快照技術,是DFT QuickBack非常重要的功能之一,它使用戶的業務系統能夠在較短時間間隔下保存各個時間點的歷史數據版本。DFT QuickBack能夠針對每個應用卷提供多達255個歷史版本,高密度的快照視圖可保證將系統的RPO(動態及靜態)降到最低范圍。一旦發生任何類型的數據丟失,維護人員都可以找到最近的數據版本立即進行恢復。而且,快照恢復與數據量無關,無論多大的數據量提取也僅僅是一分鐘內的事情。
Snapshot快照機制是利用已優化的高效快照技術,將每個時間點已被改變的數據塊都完整保存,一旦需要系統回退到某一時間點時,Snapshot可以立即通過Snapshot View的接口工具快速將這一歷史點的數據指針提取出來,從而實現歷史數據的瞬間映射和恢復機制。Snapshot快照機制在容災備份體系中,可以輕松、快速地實現數據庫數據、文件數據、系統數據等各種數據類型的時間點即時恢復,同時也能輔助生產數據的提取、分析及查詢等功能應用。
DFT QuickBack還提供了一種基于連續IO記錄日志的技術,以使數據的歷史版本更加精細化,稱為QuickBack Journal。用戶可以通過簡單的界面,任意拖動時間拉桿,或根據數據訪問流量圖等找到任何可能的故障起因時間點,然后將數據恢復到任何一個秒級時間點。
2. 數據庫一致性確認技術
數據庫系統在遠程容災應用中,具有一定的特殊性。傳統存儲設備的遠程復制技術,實現的是磁盤所存儲的數據的遠程同步,但是,對于一個實時運行的健康數據庫系統,它并不能實時的將已提交的數據刷新到磁盤上(數據庫采用了緩存機制確保交易性能,向數據文件的寫入往往會比緩存的寫入略有滯后),這樣遠程的數據庫系統在啟動時,通常需要通過日志的重構方法,才能進行數據庫的有效恢復;由于一致性的問題有可能導致數據庫缺失而無法進行立即恢復,使災難發生時的快速恢復目標無法實現。DFT QuickBack的遠程復制技術,集成了能夠感知數據庫系統的DB Agent技術,能夠在指定的快照點和復制點創建一個完整時間點的數據庫副本,從而確保數據庫日志與數據文件的一致性,以實現快速啟動數據庫的恢復目標。這種針對數據庫系統的解決方案,真正將災備體系與應用的數據庫體系結合起來。
3. 磁盤讀/寫優化技術
DFT QuickBack的SafeCache技術可以全面提升所管理的磁盤的寫入性能。當磁盤性能無法滿足主機的I/O需求時,使用SafeCache配合高速磁盤設備可以明顯改善整體性能。
SafeCache的原理是:將高速磁盤設備置于“前端”,生產數據可以先順序的寫入到高速磁盤設備中,然后按照SafeCache設置的策略(基于Cache容量或基于時間),將Cache中的數據再隨機寫入到后端存儲中。
DFT QuickBack的HotZone技術則可以全面提升所管理的磁盤的讀性能。使用HotZone時,DFT QuickBack會將磁盤劃分為容量相等的多個區域,然后監控哪些區域經常會被讀到,隨之將該區域的數據塊映射到高速磁盤中,這樣就會提高應用主機讀取磁盤的速度。如果DFT QuickBack監控到某些區域不再經常被讀到,則會將該區域移出高速磁盤。
4. WAN優化的復制技術
DFT QuickBack的復制策略非常靈活,包括連續復制與定時復制,無論哪種復制策略,都是基于增量的,只將發生變化的數據塊傳輸到遠端。用戶可以設定一種或多種策略,DFT QuickBack可以根據帶寬情況自動或手動的在多種復制策略間進行切換。通常在寬帶的遠程傳輸系統中,可以采用連續方式傳輸,而在常規的廣域網絡中,則建議采用定時方式。
DFT QuickBack的遠程復制是直接經由TCP/IP WAN傳輸數據,相比于傳統容災技術中的磁盤陣列復制經WAN專線傳輸(必須搭配一對非常昂貴的網關轉WAN),使建設、管理與維護成本大幅降低。
DFT QuickBack的復制技術還利用了精簡式傳輸MicroScan技術,以512字節為最小單位掃描磁盤變化并只傳輸發生變化的數據,從而大大節省了廣域網絡的傳輸帶寬。在多個實際應用項目中,DFT QuickBack的遠程容災傳輸占用的帶寬極小,一般只需傳統容災技術帶寬的1/50到1/5。
為什么要選擇DFT QuickBack(十個對策,一個目的)
1. 實現一體化的本地/異地備份與容災體系
DFT QuickBack一體化的備份/容災技術,使任何災難的發生都不再是致命的,用戶很輕松就獲得了備份和容災的雙重效果。進行恢復時,用戶可以自主選定在本地還是在異地進行,而且其效果遠遠超過各類傳統的災難保護方式。
2. 全面防御所有災難,徹底消除災難死角
從‘軟’錯誤,到‘硬’故障;從單個文件丟失,到站點級災難,DFT QuickBack卓越而完備的保護能力,全面覆蓋所有災難,根本沒有災難死角。
3. 瞬間恢復,數據立即可用
DFT QuickBack使‘恢復’回歸到‘立即可用’的本義。任何災難情況下,DFT QuickBack基于秒級顆粒的歷史恢復能力,使數據可以輕松回到故障前的任何一秒。另外,DFT QuickBack采用將內在故障與外在故障分層恢復的架構,讓大部分常見故障的恢復更加高效。
4. 傳輸帶寬精簡
DFT QuickBack具備數據傳輸帶寬精簡技術,使災備通訊成本大為減少。利用DFT QuickBack的精簡式傳輸技術,數據傳輸帶寬只需傳統災備技術的1/50 - 1/5,因此,傳輸成本大為降低。
5. 多種部署模式,復制策略靈活
DFT QuickBack具備4種部署模式,用戶可以根據自身需求,自由選擇部署一種,還是同時部署多種。同時,DFT QuickBack靈活的復制策略選項,使構建多點對一及多點對多點的數據保護架構更加容易。
6. 全面支持異構存儲
以往,人們在進行災備系統建設時,經常會困惑無法選擇開放式的存儲設備從而導致方案的高昂成本,DFT QuickBack技術有效的解決了這一問題。它不僅開放了災備存儲設備的選擇,所面向的對象也由集中存儲的某些設備擴展到了所有應用系統的各類存儲,包括一些DAS和內置存儲等。
7. 易于維護,簡單的圖形化管理
DFT QuickBack技術采用了全圖形化管理方式,只需移動手中鼠標,就可以對龐大的應用進行災備部署和應急管理,處理效率之高超乎想象。過去代價高昂的災備系統維護成本不僅大為下降,而且應急效率也大為提高。
8. 隨時進行災備演練
DFT QuickBack技術具有靈活的災備數據提取和驗證機制,任何演練都不再是一個難題,確保了災備體系的一致性確認以及應急流程的完善和應急人員的專業化。
9. 災備擴展成本低
DFT QuickBack技術是一種一次構建,長期受益的技術。未來業務擴展時,無需對基礎架構進行改動,擴展成本低廉,充分保護了既有投資。
10. 開放架構,節約成本,充分利舊
全面開放的架構,打破了品牌和技術的限制,全面兼容任何存儲、軟件及協議,而且可以充分利舊,使既有投資的回報率達到******。另外,通過各種精簡及壓縮技術,存儲的成本也削減了超過50%。
終上所述,DFT QuickBack不僅能夠輕而易舉的實現本地的應用系統保護和恢復,而且能夠很輕松的將保護延伸到遠程,建立起更為強大的異地容災系統。你只需要在異地容災中心部署一臺DFT QuickBack管理器,利用本地和異地QuickBack管理器的復制功能,就可以在異地同時獲得本地完整的各時間點數據,同時,本地擁有的任何恢復功能在異地的災備中心同樣具備。