英方專家服務:專屬你的災備規劃建設攻略

時間:2018-02-27 欄目:

一年之計在于春,新年開工,沒有規劃完成或規劃不夠滿意的組織,可能需要一份有價值的災備規劃建設攻略。下面就是你的專屬攻略。

 

01

數據安全與業務連續的重要性

 

IT領域,技術從傳統的IT架構到云計算架構的發展,是終端用戶對業務操作不斷優化需求所驅動的,這種應用體驗的性能包括強大的計算力、友好快捷的界面,以及流程持續的安全訪問,這些都是能夠留住終端用戶的關鍵因素。

 

支撐這些關鍵因素成立的一份調查顯示: 1秒的延遲,會導致頁面轉換率降低7%,流量下降11%,用戶滿意度降低16%;如果在完全競爭環境下,57%的訪客在等待3秒后放棄,其中80%訪客不會回來,50%訪客轉向競爭對手。

 

從這個層面講,組織機構對于業務的災備建設的規劃和實施,是確保數據安全和業務連續的有效舉措。

02

災備規劃建設三部曲

 

通常我們將業務連續性、災備規劃和災備方案設計與實施稱為災備規劃建設三部曲。

 

1)業務連續性規劃

 

災備建設的最終目的就是要保護業務的連續性運行,其具體要求需要通過進行業務連續性規劃來確定。因此,業務連續性規劃是進行災備建設的大前提。沒有業務連續性規劃,災備建設就沒有意義,充其量只能做到數據不丟失,不能及時恢復業務運行,而保障業務連續性運行才是真正核心。通過業務連續性規劃,分析梳理出各項業務的恢復優先級及其恢復要求(RTO、RPO以及恢復業務所需的資源等),進行業務連續性規劃的方法通常采用國際上流行的DRI十大最佳慣例:

 

①規劃啟動與管理

②風險評估與控制(RA)

③業務影響分析(BIA)

④制定業務連續性策略

⑤應急準備及響應

⑥編制和貫徹實施業務連續性計劃

⑦認知與培訓計劃

⑧業務連續性計劃的演練、審計和維護

⑨危機溝通

⑩與外部機構的協調

 

這是國際通用BCM規劃的方法,適用于企業和業務功能,當然也適用于信息系統。業務連續性規劃確定了保護業務的各項要求(如RTO、RPO等),支持業務運行的信息系統自然就要根據這些要求來確定相應的信息系統恢復目標和恢復策略。

 

2)災備規劃

 

災備是通過保障支持業務的信息系統的連續性運行來實現最終保護業務的正常運行。因此,在通過業務連續性規劃梳理出業務的恢復要求和恢復優先級后,就要根據這些要求來梳理支持這些業務的IT應用,同樣需要分析出這些IT應用的恢復優先級和恢復指標(RTO、RPO,以及恢復所需的資源等)。

 

災備規劃采用的方法與業務連續性規劃的方法基本一致,主要區別僅在于前者針對的是支持業務運行的IT應用和系統,后者主要關注的是業務流程。這里針對IT應用和系統的恢復要求應該與針對業務的恢復要求相匹配。通過災備規劃,確定所有支持業務運行的IT系統的各項恢復指標,并制定IT系統的恢復策略以及IT系統的恢復計劃。

3)災備方案設計和實施

 

根據災備規劃對支持業務運行的IT系統提出的恢復要求和恢復策略,來設計災難恢復技術方案,例如同城災備、異地災備、兩地三中心、雙活、云災備等等。需要注意的是,評價這些技術方案的適用性時,并非恢復時間越短就越好(恢復時間越短往往成本也越高),滿足災備規劃確定的恢復要求(RTO,RPO等)才是最為重要的。只有滿足災備規劃提出的恢復指標要求、技術成熟可靠、成本效益高的災備方案才是最佳選擇。

 

災備方案的實施是確保所設計的災備方案真正有效的重要環節,需要制定詳細的工作計劃,包括場地選址、產品選型、服務商選擇、資源保障、項目管理、驗收評審、演練測試等內容。同時還應該根據災備設計方案,結合業務連續性規劃要求,制定出完整的災備計劃(包括災難應急響應總體預案、危機溝計劃、各系統的專項應急預案等),確保各部門在災難發生時能夠統一協調地行動。

03

災備規劃的具體方法

1)風險分析與業務影響分析

 

①風險分析

 

企業需要根據自身所處環境的實際情況,確定IT運行環境中存在哪些無法接受的物理威脅或者可能發生的災難,并對災難發生的可能性、目前可能的防護措施的有效性和該災難所威脅的資產價值進行分析,最終得到帶有優先級別的需要防范的風險及其分級列表,并制訂出可能的處理方法。例如接受該災難發生時的風險而不進行防范、制訂該災難的預防措施或者采取購買保險等風險轉嫁策略。

 

②業務影響分析

 

在本階段,通過走訪各業務部門的相關人員對各種業務流程進行分析,了解各種業務流程對企業的重要性和時間敏感性。同時根據相關的評判原則,得出在核心流程由于災難發生而無法正常進行時企業本身的損失情況。這種損失可能是可以量化的,例如單據的丟失、計算的錯誤而導致的直接損失;也可以是無形的損失,例如客戶滿意度及競爭優勢的丟失。通過對可量化和不可量化損失的綜合考慮,得出各種核心業務流程對于災難受損的可容忍程度,并作為確定其恢復優先級的決策依據,最終確定這些核心業務流程的恢復要求指標,例如RTO、RPO、DOO、NRO以及恢復所需的各種資源等。

2)災備方案設計

 

結合分析階段的分析成果,以及企業本身在災備上的投入,制訂企業短期、長期范圍內的災備策略和目標,并有意識地將企業本身的人員組成和組織架構做出調整以適應策略要求。本階段最為重要的是制訂出災備的具體實施方案。

 

災備方案可供選擇的范圍很大,但所有的災備方案都必須考慮的因素包括恢復時間、實施與維護災備策略所需的投入等。災備恢復時間的需求越短,所需的實施成本就越大,實施難度也就越高。

 

3)災備計劃制定

 

有了IT系統的恢復方案,只能夠保證在災難發生時,IT系統的恢復能夠支持業務的恢復目標,但是業務的連續性并不只是IT系統的恢復。因此,災備方案在設計中還需要涉及包括辦公場地、辦公設備、緊急流程、指揮架構、人員調度等多方面、多部門的綜合考慮。只有業務執行過程的每一個環節都達到災備目標的要求,才能夠認為災備方案的目標得到了滿足。因此,需要制定一個完整的災備計劃,來統一協調各部門在災難發生時的行動計劃。同時制定災備計劃時需要確保其與企業業務連續性計劃協調一致。一般來說,每個企業都應該設立一個由領導掛帥,各業務部門和IT部門聯合組成的災備指揮小組。

4)災備方案實施

 

災備體系的搭建經常需要涉及到公司內多個部門的協調,因此在方案實施的過程中,需要把每項工作的內容、目標要求、實施的方法步驟以及督促檢查等各個環節都做出具體明確的安排,具體落實到工作分幾個階段、什么時間開展、什么人來負責、領導及監督如何保障等。

 

方案在實施的過程中具有很強的規定性。方案實施的規定性表現在兩個方面:一方面,方案實施要根據方案分析和方案設計的具體操作流程進行,而不能是隨意進行。有效的災備操作流程往往可以節省大量的時間和減少錯誤。反之,就會帶來不必要的損失。例如,在虛擬環境下的災備系統,就要提前規劃需要用幾臺服務器去虛擬出三十、四十,甚至上百的虛擬服務器,而且需要長期運行。如果沒有好的操作流程,這對災備中心的運維是非常不利的。另一方面,方案實施工作具有強制性,一旦開啟,相關部門單位就要按照具體計劃認真組織實施。

 

5)災備演練

 

災備演練是基于不同災備類別中某一特定的場景而進行的,災難場景不同、災備技術復雜度不同,演練的技術過程與周期也不盡相同。

 

具體的演練包括:系統更新、調整,原有的災難恢復預案是否仍然有效;災備系統是否需要進行有效的更新;系統切換流程、步驟是否有遺漏和錯誤;災備系統的切換時間是否可以滿足業務的恢復需要等等。

04

常見的三種災備演練方式

1)桌面演練

 

桌面演練也叫“沙盤推演”,是最基礎的災備演練方式。通過對初始災難恢復預案的一個理論驗證,進而測試急響應預案和災難恢復體系的完整性和有效性,使相關人員了解應急響應及業務恢復流程,全面驗證技術及業務管理指揮、流程操作、協調配合等方面的綜合能力。桌面演練工作量小,易于實施,可以根據實際需求靈活開展,并可以模擬多個場景。

 

2)模擬演練

 

模擬演練以桌面演練結果為基礎,由IT部門與相關業務部門參加模擬演練,采用模擬數據和模擬業務系統運行演練。模擬演練的過程高度接近真實災難發生時的處理過程,通過演練可以檢驗災備系統的可用性、災難恢復預案的可行性以及增加參演人員對災難處理過程的感知度與配合的默契度。

 

模擬演練是一種對現有生產環境沒有影響的演練方式,由于需要虛擬出較為真實的使用場景,因此在技術上的要求較高。

 

3)實戰演練

 

實戰演練需要災備中心真正接替生產運行一段時間,是在具體設定的災難場景下,將業務切換到災備中心及業務恢復環境,并在完成數據、應用及業務恢復后由災備系統提供對內對外的業務服務,原來的生產環境可以進行必要的系統維護或者為災備環境提供備份支持。

 

作為災備演練的最高的階段,實戰演練的場景最為真實,更易于發現潛在問題并進一步完善災備系統,但隨之而來的就是演練成本的提高。因此,在實戰演練中,也會存在很多挑戰,這時,關鍵是要獲得高管層的理解和支持,使其理解并支持成功演練的標,同時能夠發現問題改進計劃才是成功的演練(無論是否用到真實環境),應避免流于形式的表演。

驗證已建成災備系統的可用性、有效性,通過演練結果來修正、補充、完善災備恢復預案并為災備系統的升級建設提供理論依據及數據指標,從而使企業在災備建設中有據可依,保證建成的災備系統能充分實現建設的目的、達到建設的目標。這就是災備演練的意義所在,并敢于考驗演練中團隊的決策與指揮能力。

 

05

專家服務(ADTIS)

 

1)定義

 

英方專家服務是災備行業常見的咨詢服務,已經推出的ADTIS專家服務業務,旨在減少中間環節、降低無效成本,并最終實現快速部署、高效可靠的專家級業務服務體系,從0到100,全程專家指導。

 

2)特點

 

針對性強、效力高、可執行;

階段劃分和決策點明晰;

經驗證的模塊化實施方法;

終身服務。

 

3)專家服務的5個階段

 

專家服務的5個階段

 

①評估階段(Assessment)

 

需要對企業的整體災備目標及投入進行有效的評估,包括RPO、RTO的相關指標以及IT系統的整體架構,主要以專題會的形式進行,并且就相關事項形成書面紀要,評估階段主要以免費的形式進行,但由于評估階段也需要投入大量的資源進行對接,因此部分服務會保留收費的權利。

 

②設計階段(Design)

 

針對評估的具體結果,在雙方合作意向明確的前提下,由專家團隊主導進入設計階段。此階段將會直接影響項目的最終交付。因此,英方將以經驗證過、穩定的系統為藍本提供完善可執行的災備設計規劃,并在此過程中,積極聽取需求方的意見。

 

③測試階段(Test)

 

為保證項目的順利進行,英方將對已經設計好的災備系統進行實地測試,同時保證在測試的過程中不對用戶的現有系統造成影響,測試階段主要包括軟件的具體使用、功能的具體實現以及災備演練。測試可以暴露災難恢復計劃的不足之處,測試也可以幫助我們評估計劃執行人員的快速響應能力和效率,災難恢復計劃的每一個要素都必須測試,保證其恢復過程的準確性。

 

④實施階段(Implementation)

 

此階段指項目的現場或遠程交付階段,此階段的主要工作是項目實施人員根據設計、測試階段確認的具體需求內容進行具體功能的實現工作。在功能實現的過程中,項目實施人員將記錄軟件實現的詳細過程,便于售后服務之用。每一個實施技術人員都將嚴格按照要求記錄、存檔。

 

⑤維護階段(Support)

 

在新需求、新技術的不斷涌現以及新的內部和外部規則的變化過程中,IT系統也會隨之改變,所以要確保災難恢復計劃的有效性就必須定期的檢查和修改計劃。項目上線運行后,系統運營維護的主要工作將交由客戶進行,但英方將提供一整套完善的技術支持服務,保證在產品生命周期內有效性。

以上內容出自英方工程師給成千上萬用戶進行災備規劃建設后總結的經驗,對每個行業用戶有一定的借鑒意義。而在解決具體問題時,需要工程師對生產環境進行詳細的分析,如果你有這方面的服務需求,歡迎給本公眾號留言,向英方全國各地的技術工程師顧問進行咨詢(注明地域+姓名+單位+聯系方式)。

及時響應,快速服務,為您保駕續航

立即注冊

請先完成圖形驗證

驗  證  碼:

請先完成圖形驗證

驗  證  碼:

隱私聲明
當您在本網站進行合作伙伴注冊登記,本網站將收集您的相關信息,并保存記錄。本網站收集的個人信息包括但不限于:姓名、地址、公司、所在地區、電話號碼以及電子郵件地址等。您主動提供的信息越多及越準確,我們就能夠更好地為您提供有關服務。
咨詢·購買
星际争霸战在线客服 三多棋牌游戏中心? 黑龙江福彩p62开奖结果 哈哈棋牌游戏? 北京幸运28在线预测99 山西11选5开奖信息 e球彩贴吧 5分快3走势图技巧 31选7开奖号码结果 qq麻将官方下载 股票融资的优缺点 麻将来了是不是都是机器人 极速十一选五app下载 期货配资网 河北11选五一定牛跨度 沙麻是长沙麻将吗 今天江苏快三豹子推荐