久久99国产精品尤物|久久黄色视频二区|三级在线播放试看无码一区二区|国产综合在线观看精品12

電話:+86 574 88168918 郵箱:sales@aliance.cn

首頁-新聞動態-新聞詳情

數據中心遭破壞后如何恢復!!!

發布時(shi)間:作者:cobinet 10G屏(ping)蔽模塊(kuai)瀏覽:547次來源:機房百科(ke)
CobiNet(寧波)推薦文章:

是(shi)互聯網(wang)、和大數(shu)據(ju)等產業的(de)(de)(de)(de)組成的(de)(de)(de)(de)重要(yao)基礎設施,盡管許多企業為了(le)降低一系(xi)列(lie)的(de)(de)(de)(de)商業風險,包(bao)括(kuo)那些(xie)(xie)數(shu)據(ju)中心的(de)(de)(de)(de)風險,有(you)(you)業務(wu)連(lian)續性(xing)計(ji)劃或災難恢復(fu)計(ji)劃,但(dan)有(you)(you)些(xie)(xie)企業卻沒有(you)(you),或者(zhe)他(ta)們就算是(shi)有(you)(you)計(ji)劃但(dan)也過于籠統。當你在(zai)制(zhi)定數(shu)據(ju)中心災難恢復(fu)方案的(de)(de)(de)(de)時候,你的(de)(de)(de)(de)目標是(shi)為了(le)保護公(gong)司在(zai)信息(xi)技術、通信和人(ren)員方面的(de)(de)(de)(de)投入(ru)。一旦遭(zao)到(dao)破壞,你的(de)(de)(de)(de)數(shu)據(ju)中心要(yao)么是(shi)完(wan)全不受影(ying)響(xiang)要(yao)么就可能(neng)遭(zao)到(dao)徹底的(de)(de)(de)(de)毀(hui)壞。

通過對數據中(zhong)心決策者的(de)(de)廣(guang)泛(fan)調(diao)查,商業分析企業451研(yan)究公司發現,82%受訪(fang)者表示擁有某種(zhong)形式的(de)(de)災難(nan)恢(hui)復(fu)(DR)計劃(hua),這意味著(zhu)將近五分之一的(de)(de)企業的(de)(de)災難(nan)恢(hui)復(fu)(DR)計劃(hua)沒(mei)有到(dao)位。研(yan)究發現,93%的(de)(de)組織擁有業務連續性計劃(hua)(BCPs)。隨著(zhu)數據中(zhong)心越(yue)來越(yue)面臨著(zhu)風險,如今的(de)(de)企業目前廣(guang)泛(fan)使(shi)用(yong)災難(nan)恢(hui)復(fu)解決方(fang)案,沒(mei)有什么理由和(he)借口(kou)不(bu)制(zhi)定這些(xie)計劃(hua)。

如(ru)何預防電氣火災這(zhe)(zhe)是(shi)企業必須要了(le)(le)解到的層面,首先(xian)在(zai)數據中心中添加一個聲(sheng)音報警和(he)兩個分解總線。在(zai)DR站點(dian)恢復(fu)了(le)(le)IR操作運營,而這(zhe)(zhe)也(ye)僅僅是(shi)針對(dui)最高級別的優先(xian)系(xi)統。有(you)了(le)(le)便(bian)攜(xie)式空調設備(bei)(bei)、臨時通(tong)信和(he)小(xiao)型(xing)不間斷供電設備(bei)(bei),我們(men)就可(ke)以(yi)恢復(fu)手機通(tong)訊(xun)。需(xu)要花費(fei)幾個星(xing)期的時間才能替換(huan)大型(xing)交換(huan)機燒毀(hui)的部件,但是(shi),我們(men)還是(shi)需(xu)要了(le)(le)解哪里(li)出現了(le)(le)故障,以(yi)便(bian)杜絕再(zai)次發(fa)生此類(lei)事故。

以下使我(wo)們(men)(men)所發(fa)現的(de)六個(ge)故障點,然后我(wo)們(men)(men)在災難恢復報告中做了記錄(lu)。

隱患點一:空調設(she)備(bei)盡管我(wo)們(men)配備(bei)了多個空調設(she)備(bei),但(dan)(dan)是(shi)這些設(she)備(bei)都公用一個接(jie)線(xian)總(zong)機。只(zhi)有(you)(you)兩個冗余單元和(he)一組(zu)不(bu)間斷供(gong)電(dian)設(she)備(bei)(簡(jian)稱UPS)室(shi)單元的(de)(de)電(dian)源是(shi)分開的(de)(de),設(she)計師(shi)認(ren)為這種思路(lu)(lu)是(shi)合乎邏輯(ji)的(de)(de),但(dan)(dan)是(shi),實際上這是(shi)否定了備(bei)用的(de)(de)想法。我(wo)們(men)還(huan)未能(neng)夠(gou)正確設(she)置(zhi)總(zong)斷路(lu)(lu)器(qi)(qi)上的(de)(de)跳(tiao)閘電(dian)流,工程師(shi)們(men)和(he)承包(bao)商還(huan)沒有(you)(you)調整(zheng)好斷路(lu)(lu)器(qi)(qi)。因此,當一臺空調設(she)備(bei)遇到問題時,主斷路(lu)(lu)器(qi)(qi)就會(hui)跳(tiao)閘現(xian)象(xiang),而不(bu)是(shi)單個支路(lu)(lu)斷路(lu)(lu)器(qi)(qi)跳(tiao)閘,這樣(yang)會(hui)造成80%的(de)(de)冷(leng)卻資源浪費。紅外(wai)線(xian)掃描(miao)可以(yi)在(zai)接(jie)線(xian)總(zong)機中完成,但(dan)(dan)是(shi)只(zhi)有(you)(you)一部(bu)分空調設(she)備(bei)能(neng)夠(gou)運行。未達到滿載,設(she)備(bei)也不(bu)會(hui)溫度過高,因此,在(zai)測試過程中,我(wo)們(men)也不(bu)會(hui)發現(xian)連接(jie)松動的(de)(de)現(xian)象(xiang)。

第二(er)個(ge)(ge)連線(xian)總(zong)機跟第一(yi)個(ge)(ge)連線(xian)總(zong)機一(yi)樣,在同一(yi)個(ge)(ge)電(dian)(dian)器柜中(zhong),這(zhe)樣做的(de)目的(de)是滿足財務預(yu)算,因此,兩(liang)條電(dian)(dian)源總(zong)線(xian)是彼此相(xiang)鄰的(de)狀態。當一(yi)個(ge)(ge)發生(sheng)爆炸時,也(ye)會同樣引(yin)爆第二(er)個(ge)(ge),然后(hou)我們就什么(me)也(ye)沒(mei)有了。

 

隱患點二:數(shu)據(ju)(ju)中心(xin)(xin)設計(ji)在(zai)災(zai)難恢(hui)復報告中,我(wo)們所要(yao)檢查(cha)的(de)(de)另外一個(ge)項目就是數(shu)據(ju)(ju)中心(xin)(xin)設計(ji)。因為,一臺發(fa)電(dian)(dian)(dian)機要(yao)供整(zheng)個(ge)大樓使(shi)用,轉換開關設置在(zai)地下室(shi)、接線(xian)(xian)總機的(de)(de)上方。并沒有感知到(dao)即將(jiang)發(fa)生的(de)(de)電(dian)(dian)(dian)源故障,但(dan)是被毀壞(huai)的(de)(de)接線(xian)(xian)總機卻會阻止(zhi)我(wo)們。共(gong)用一個(ge)發(fa)電(dian)(dian)(dian)機,我(wo)們本應該設置多(duo)個(ge)自(zi)動(dong)交換機提供數(shu)據(ju)(ju)中心(xin)(xin)內(nei)(nei)數(shu)據(ju)(ju)轉換。用這種方式,如(ru)果將(jiang)電(dian)(dian)(dian)源引入到(dao)數(shu)據(ju)(ju)中心(xin)(xin)中,且(qie)建筑內(nei)(nei)其他設備未受影(ying)響,那么,發(fa)電(dian)(dian)(dian)機便會開始工作,數(shu)據(ju)(ju)中心(xin)(xin)也會恢(hui)復緊急電(dian)(dian)(dian)源的(de)(de)使(shi)用。

我們(men)(men)反對(dui)電(dian)氣(qi)室(shi)與數據(ju)中(zhong)(zhong)心(xin)相鄰(lin)過近,因為,我們(men)(men)不(bu)希望電(dian)氣(qi)涉及到(dao)計算環(huan)境中(zhong)(zhong)。我們(men)(men)曾忽視了(le)這一點。電(dian)氣(qi)室(shi)空調設(she)備(bei)運(yun)行正常,數據(ju)中(zhong)(zhong)心(xin)中(zhong)(zhong)設(she)備(bei)停止運(yun)行,此時(shi),電(dian)氣(qi)室(shi)會產(chan)生正壓。當門打開時(shi),爆炸所產(chan)生的熱量和煙霧會隨(sui)之發散(san)。

隱患點三:煙(yan)(yan)霧(wu)探(tan)測(ce)器(qi)的問題早(zao)期的預警(jing)煙(yan)(yan)霧(wu)探(tan)測(ce)器(qi)會(hui)立即識別(bie)危(wei)險(xian),而(er)且還可以控制(zhi)氣(qi)體滅火,雖然(ran)其設(she)(she)置方式并非正確。因(yin)此,發(fa)現(xian)(xian)危(wei)險(xian)源時該探(tan)測(ce)器(qi)并不是(shi)發(fa)出(chu)警(jing)報,而(er)是(shi)根據它感應到(dao)的煙(yan)(yan)霧(wu),觸發(fa)其釋放(fang)氣(qi)體的功能(neng)。煙(yan)(yan)霧(wu)顆粒(li)同(tong)樣(yang)可以污染其他正常運(yun)行(xing)設(she)(she)備(bei)的過濾(lv)器(qi)。唯一(yi)一(yi)個好消息是(shi),與兩個備(bei)用設(she)(she)備(bei)一(yi)樣(yang),電(dian)氣(qi)室內(nei)的空調(diao)設(she)(she)備(bei)都在(zai)同(tong)一(yi)個電(dian)路(lu)上,因(yin)此,可以繼續運(yun)行(xing)。沒有(you)制(zhi)冷(leng)設(she)(she)備(bei),UPS會(hui)迅(xun)速升(sheng)溫,然(ran)后關閉(bi)之前的計算機房。UPS應該走旁路(lu),維護主機電(dian)源,但是(shi),測(ce)試中(zhong)我們(men)卻發(fa)現(xian)(xian),旁路(lu)連接出(chu)現(xian)(xian)錯誤(wu)。只有(you)一(yi)臺(tai)空調(diao)設(she)(she)備(bei),受到(dao)損(sun)害的可能(neng)性非常大。

隱(yin)患點四:優先(xian)等級UPS可以通過網絡進行按(an)(an)序(xu)服務關系,但是,由(you)于存(cun)在(zai)優先(xian)等級問題,這(zhe)個想法一直也沒有實現。我們(men)還了(le)解到(dao),其實并(bing)不(bu)需(xu)(xu)要(yao)Emergency Power Off按(an)(an)鈕(niu),因(yin)此,也不(bu)會存(cun)在(zai) 高架(jia)活動地(di)板(ban) ,不(bu)需(xu)(xu)要(yao)使用(yong)任何限制。工程師們(men)指出了(le)該行業(ye)一些非常危(wei)險的(de)按(an)(an)鈕(niu), 因(yin)為每一個數(shu)據中心(xin)都會有一個危(wei)險按(an)(an)鈕(niu), 但是其中并(bing)不(bu)包(bao)含任何防護(hu)按(an)(an)鈕(niu),防止其被過早使用(yong)。

數據中心管理人(ren)員將會面臨無數個挑戰任(ren)務。我們要學會如何能(neng)夠(gou)將這些(xie)實際過程中會接觸(chu)到的任(ren)務進行優先(xian)等級(ji)排(pai)列。

隱患點(dian)五:DCIM報警當我問到,數據中心(xin)基礎設施管理(簡(jian)稱DCIM)工(gong)具會提醒我主要警告(gao),但(dan)是(shi)唯一的(de)(de)局限(xian)就是(shi)ASHRAE的(de)(de)允許溫(wen)度(du)(du),這個溫(wen)度(du)(du)限(xian)制高于數據中心(xin)的(de)(de)實際冷卻溫(wen)度(du)(du)。由于冷卻溫(wen)度(du)(du)的(de)(de)設定是(shi)建立在(zai)(zai)之前的(de)(de)推薦(jian)溫(wen)度(du)(du)值的(de)(de)基礎上,而(er)且要比推薦(jian)溫(wen)度(du)(du)更低,因此,在(zai)(zai)還未出發報警之前就已(yi)經宣告(gao)失(shi)敗了,我們還需要花費很多時間來進行救災搶修。

DCIM還會顯示出(chu),我們所(suo)設(she)置的10個空調設(she)備中有8個都宣布(bu)設(she)置失(shi)敗,同(tong)時(shi)也陳述了失(shi)敗的原(yuan)因(yin)和影響因(yin)素(su),我們沒(mei)有為DCIM系統購買(mai)機械設(she)備模塊,因(yin)此,當冷卻單元裝置失(shi)靈時(shi)并沒(mei)有發出(chu)警告提示。這(zhe)一點也會被記錄到災難恢復報告中。

隱患(huan)點六:缺乏(fa)訓練和(he)標準(zhun)實際工作(zuo)中,我們(men)需要進(jin)行多(duo)次DCIM培訓,GUI非常復(fu)雜,會提供許多(duo)詳細的(de)數據(ju),使我們(men)辨識(shi)起(qi)來非常困難。我們(men)嘗(chang)試重新對GUI進(jin)行修訂,這樣,我們(men)可以看得更加清晰明(ming)了,但是(shi),其可配(pei)置性卻非常低。

IT應該包(bao)含(han)在(zai)(zai)重要系統(tong)的(de)選(xuan)擇范圍內,在(zai)(zai)購(gou)買(mai)之前,進行同類測(ce)試,明確如(ru)何衡量其他軟(ruan)件。我(wo)們非常(chang)清楚地知道(dao),這并(bing)不屬于III級(ji)事故,正(zheng)規認證將(jiang)會披露這些漏洞。公司(si)避免(mian)了(le)許多承包(bao)備份和(he)DR站(zhan)點所引起的(de)麻煩,因(yin)此,開發和(he)測(ce)試計(ji)劃的(de)失敗(bai)原因(yin)在(zai)(zai)于我(wo)們自己(ji)。作為災(zai)難恢復(fu)報告中的(de)一部分,我(wo)們花(hua)費了(le)許多時間、非常(chang)認真的(de)審閱了(le)DR站(zhan)點合同,并(bing)且根據(ju)審閱過(guo)程中發現(xian)的(de)問題(ti)提出了(le)一些改善(shan)建(jian)議。在(zai)(zai)制定DR計(ji)劃時,我(wo)們也獲(huo)得了(le)一些幫助,通過(guo)轉接(jie)操作,現(xian)在(zai)(zai)我(wo)們可以(yi)一年進行兩次(ci)測(ce)驗工作。

數據中心遭破壞后解決(jue)方案的實(shi)施

災難恢(hui)復(fu)方(fang)案(an)應(ying)該(gai)是(shi)靈活的(de)(de)(de)、可(ke)擴展的(de)(de)(de),這樣(yang)才(cai)能應(ying)對(dui)(dui)各種(zhong)破壞(huai)場景。本(ben)文將提供數據中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)檢(jian)查(cha)清單(dan),并給出(chu)在災難之后可(ke)以采(cai)取哪(na)些行動的(de)(de)(de)建議。這份清單(dan)將使得災難恢(hui)復(fu)變得更為簡單(dan)。當你在檢(jian)查(cha)一次破壞(huai)性事件(jian)對(dui)(dui)你的(de)(de)(de)數據中(zhong)(zhong)心(xin)(xin)產生的(de)(de)(de)后果(guo)時,請(qing)務(wu)必參考這份數據中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)檢(jian)查(cha)清單(dan),或(huo)者是(shi)針對(dui)(dui)你自己(ji)的(de)(de)(de)要(yao)求(qiu)對(dui)(dui)它進行修改。當你完成(cheng)了對(dui)(dui)于破壞(huai)情形的(de)(de)(de)初步評估(gu),并且(qie)對(dui)(dui)你的(de)(de)(de)員工所處的(de)(de)(de)位置(zhi)滿意之后,再開始(shi)根據災難恢(hui)復(fu)方(fang)案(an)采(cai)取行動。

制(zhi)定(ding)數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)災(zai)難恢復計(ji)劃(hua)時(shi)的(de)(de)(de)若干假定(ding)一項數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)災(zai)難恢復計(ji)劃(hua)僅僅關注(zhu)于數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)設(she)施和(he)基(ji)礎(chu)設(she)備,比如它的(de)(de)(de)物理位置、建(jian)(jian)設(she)、安全、能源、環境系統以及它的(de)(de)(de)工作人(ren)(ren)員。你(ni)不光(guang)要(yao)考(kao)慮(lv)到數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)運作的(de)(de)(de)部分(fen),也要(yao)考(kao)慮(lv)到支持它工作的(de)(de)(de)人(ren)(ren)。這(zhe)意味著在制(zhi)定(ding)DR方案時(shi),要(yao)滿足以下條件(jian):1、數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)技術和(he)管理人(ren)(ren)員,包括所有(you)的(de)(de)(de)班次2、數(shu)(shu)據(ju)(ju)中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)建(jian)(jian)筑(比如,物理的(de)(de)(de)基(ji)礎(chu)設(she)施、建(jian)(jian)筑物、出入口位置、提升地板的(de)(de)(de)區域)

3、建筑的位置(zhi)(比如,進(jin)入路線、離高速公路、火車線路、飛機(ji)場有多近,離燃油儲存柜的距離)

4、電能的產生(比如,商業用電、備(bei)用電源系統(tong))

5、電能保(bao)護(比(bi)如(ru),接地及連結(jie)、避雷針、線(xian)路調節(jie)器、電涌抑制器)

6、環(huan)境(jing)(比如,供暖、通風備以(yi)及空調)

7、關鍵(jian)系(xi)統(tong)(比如,服務(wu)器、配電裝置、VoIP系(xi)統(tong)、呼叫中心系(xi)統(tong))

8、網絡設備(比如,電纜、連接(jie)器(qi)、路由器(qi)、銅和(he)光纖線路、電纜架)

9、安(an)全(物理進入和信息(xi)安(an)全)

10、工作空間(jian)(比如,辦公室(shi)、會議(yi)室(shi)、辦公小隔(ge)間(jian)、家(jia)居、照明)

11、防火(huo)(huo)(比如,火(huo)(huo)災探測(ce)器、煙霧探測(ce)器、滅(mie)火(huo)(huo)器、FM200滅(mie)火(huo)(huo)系統)

12、建筑樓層和墻體(耐(nai)火(huo)墻、提升地(di)板)

13、公共(gong)設施(shi)(比如,水、電(dian)、下水道(dao)、通信)

提升(sheng)面對緊急情況時候的(de)響應(ying)能(neng)力(li)

作為(wei)災備規(gui)劃中(zhong)及(ji)時(shi)響應(ying)的一部(bu)(bu)分要(yao)求,當我們在制定響應(ying)行動(dong)計劃的時(shi)候(hou),如果房屋(wu)是租(zu)賃的或者自有的,那么需(xu)要(yao)和(he)房屋(wu)管(guan)理部(bu)(bu)門或者設施管(guan)理部(bu)(bu)門協商,除此之外(wai),IT部(bu)(bu)門也需(xu)要(yao)溝(gou)通。制定好響應(ying)計劃后,還需(xu)要(yao)復查一下和(he)內(nei)部(bu)(bu)以(yi)及(ji)外(wai)部(bu)(bu)資(zi)源進行充分溝(gou)通以(yi)確保所有部(bu)(bu)門都萬(wan)無一失(shi)。

在(zai)災難恢復計劃(hua)設計過程中需(xu)要(yao)考量的因素如(ru)下:1、和(he)不同IT部(bu)門(men)之間的關系(xi),比如(ru)內部(bu)技術(shu)團(tuan)隊,應用(yong)團(tuan)隊和(he)網(wang)絡團(tuan)隊等。以確保所有(you)日(ri)常(chang)使用(yong)數據中心設施的團(tuan)隊部(bu)門(men)全部(bu)都(dou)在(zai)災難響應流程里。

2、與外部股票持有者之(zhi)間的關系(xi),比(bi)如廠(chang)商以及服(fu)務提供商。

3、如(ru)果公司油氣田辦(ban)公室的(de)(de)話,和其他(ta)辦(ban)公室之間的(de)(de)關系特需(xu)要考慮進(jin)去,因為他(ta)們也(ye)可能會是災(zai)難(nan)恢復規劃(hua)中的(de)(de)一部分(fen)。比如(ru)說要提高另外的(de)(de)數據中心機房等。

4、和架構相關的文檔,比(bi)如說(shuo)建設規(gui)劃,樓面(mian)規(gui)劃,系(xi)統視(shi)圖,網絡拓撲以及(ji)設備配置信(xin)息(xi)等(deng)。

在災難(nan)響應的制定中需要考慮(lv)到以下的幾個方面:

1、管(guan)理層對數(shu)據中(zhong)心最有威脅(xie)的幾(ji)個方面(mian)(mian)的認識,比如(ru)火災、人(ren)為(wei)操作不當(dang)、斷電(dian)、系(xi)統故障和(he)安(an)全問題(ti)。有可能管(guan)理層開始做的預想不符合實(shi)情,但(dan)需要在后(hou)面(mian)(mian)快速做出正確的改變。

2、管理層(ceng)需要意識到數據中(zhong)心里(li)最容易出問(wen)題的環節(jie),比如說,陳(chen)舊的備份電力保障(zhang)系(xi)統。

3、之前數據(ju)中心故障的處理結果(guo),比如,如何應對情況的以(yi)及我們從中學到了(le)些什么。

4、管理層對(dui)數據中(zhong)心宕(dang)機能(neng)接受的最(zui)長時間是多少。

5、行業現有的(de)應對數據中心宕機的(de)準則是怎樣的(de)。

6、從其他數據中心災(zai)難恢復經(jing)驗中學到的。

7、受訓過的數(shu)據中心緊急響應團隊(dui)處理突發事件(jian)的能力。

8、主數據中心和備用數據中心服務提供(gong)商的緊(jin)急(ji)響應(ying)能(neng)力(li)以及兩個(ge)數據本身的緊(jin)急(ji)響應(ying)能(neng)力(li)。如果之前使用過(guo)(guo),那么當(dang)時用的時候遇(yu)到過(guo)(guo)問題嗎?此(ci)外(wai)還需要了解(jie)服務的成本以及服務合同(tong)目前的情(qing)況。



文章編輯:CobiNet(寧波)  
本公司專注于電訊配件,銅纜綜合布線系列領域產品研發生產超五類,六類,七類屏蔽網線/屏蔽模塊及相關模塊配件, 我們是萬兆屏蔽模塊10G屏蔽模塊屏蔽線生產廠家。

 歡(huan)迎來(lai)電(dian)咨詢0574 88168918,郵箱sales@aliance.cn,網址aliance.cn

相關新聞

 

?2016-2019寧波科博(bo)通信技(ji)術(shu)有限公司版權所有