熱搜關鍵詞: 動環(huán)監(jiān)控 , 機房動環(huán) , 機房監(jiān)控 ,
數據中心機房監(jiān)控體系主要是對機房內設備和環(huán)境進行集中監(jiān)控和管理,經過采集機房運行中的各種數據參數,來判斷是否出現異常,對數據中心機房具有重要意義。機房監(jiān)控體系包含多個方面,而不只是簡單的視頻監(jiān)控,理論上,機房任何區(qū)域都有出現問題的可能,監(jiān)控體系的覆蓋性一定程度上決議機房運行的穩(wěn)定性。下面就來詳細介紹一下數據中心機房的三大監(jiān)控體系,以及它們各自具有的功能。
(一)數據中心機房之“設備監(jiān)控體系”
數據中心機房里的設備不計其數,對這些設備的運行狀況進行監(jiān)控非常必要,比如服務器運行的CPU內存參數,網絡設備的端口流量,業(yè)務層面的監(jiān)控等等,設備層面的監(jiān)控就更為雜亂了,需要對設備的各種運行參數比較清楚,因此一般設備的監(jiān)控體系都采用設備廠家提供的監(jiān)控軟件或許規(guī)范的第三方軟件來進行管理。
(1)經過這些監(jiān)控軟件,7*24小時對設備運行的各種參數進行監(jiān)控,一旦發(fā)現有異常就發(fā)出告警。
(2)告警的方式也比較多,能夠打印到日志主機上,能夠經過短信發(fā)送到運維人員的手機上,也能夠經過軟件體系自行嘗試修復。
(3)監(jiān)控的軟件做的是否完善將決議故障出現時,能否給出告警,所以觸及設備的監(jiān)控往往是在不斷完善的進程,許多監(jiān)控參數都是經驗之道,甚至是前史的經驗,只要經過不斷地改進、優(yōu)化,才能將發(fā)生的風險及時發(fā)現,當然要做到所有的故障都可能提前預知、發(fā)現,是非常困難的。
(4)有時的故障可能無任何預兆,尤其是硬件故障,會突然出現,而往往監(jiān)控體系是無法監(jiān)測到硬件級別的、元器件的故障。
(二)數據中心機房之“視頻監(jiān)控體系”
和其它的商務建筑一樣,數據中心機房也需要部署視頻監(jiān)控體系。視頻監(jiān)控主要是對進出數據中心機房的人員進行監(jiān)控,在數據中心機房的出入口要部署攝像頭,在數據中心機房內部樓道,重要的機房入口都要部署。
在有的非常重要業(yè)務的機房內,有時也要部署攝像頭,以便防止一些人員的惡意操作或許誤操作,發(fā)現這些異常時及時制止,以防止給數據中心機房業(yè)務帶來影響。數據中心機房里的許多設備、儀器都是非常貴重的,因為人為的原因導致損壞的狀況是非常多見的,還有便是防止一些偷盜行為。比如數據中心機房里的光模塊,一個光模塊,尤其是40G/100G光模塊,一個都要數千元,順手拿出去幾個,轉手能夠獲利上萬元。
有了視頻監(jiān)控體系,就能最大限度地防止這些行為出現,或許在出現后能夠經過這些監(jiān)控錄像進行分析、追責,這些視頻錄像是重要的證據,所以視頻監(jiān)控體系是數據中心機房不可缺少的一部分,有的數據中心機房除了視頻的監(jiān)控,還要在數據中心機房出入做好人員訪問掛號作業(yè),對外來人員進行管理,防止放入一些惡意分子。
(三)數據中心機房之“煙霧溫濕監(jiān)控體系”
數據中心機房一樣怕火,一旦發(fā)生火災對于數據中心機房來說便是毀滅性的打擊。以往也出現過一些慘痛的經驗,所以對于放火,數據中心機房且不可大意。數據中心機房和其它的建筑不同,內部有太多的電子設備,并不適用于噴淋體系,只能采用干粉救活或許惰性氣體救活。
當機房內的煙霧濃度超過了報警器設定的門限,即觸發(fā)監(jiān)控體系,及時將火滅除,除了煙霧,機房內的溫度和濕度也是需要監(jiān)控的重要部署。數據中心機房內部要盡量保持恒溫恒濕,但實際上在數據中心機房內部會有局部的溫度死角,長期以往會大大下降電子設備的使用壽命,經過在數據中心機房內多個區(qū)域部署溫濕度傳感器,建立起溫濕度的監(jiān)控網絡,就能夠及時地發(fā)現局部區(qū)域過溫過濕的狀況,在一些空氣污染較為嚴重的地方,還能夠部署空氣清潔度監(jiān)測的設備,數據中心機房設備運行在污染嚴重的環(huán)境里,容易造成靜電、電容擊穿器件等故障,為何我們要求數據中心機房設備要周期性地進行除塵便是這個道理,本身灰塵中就含有不少的污染物。
數據中心機房在高速的發(fā)展,各種新技術層出不窮,也讓數據中心機房運行變得愈加雜亂,這給監(jiān)控體系也帶來了不小的挑戰(zhàn),如何經過監(jiān)控體系及時發(fā)現運行風險,是監(jiān)控體系關心的永久話題。
雖然數據中心機房有各種各樣的監(jiān)控體系,但是能夠確定的是監(jiān)控體系無法提前發(fā)現所有的故障,尤其是設備級別的故障,但是經過完善的監(jiān)控體系的確能夠大大防止許多故障。就算監(jiān)控體系沒有在發(fā)生故障時,給出告警,但是在事后故障分析中,監(jiān)控體系的各種技術參數和記錄依然是可供分析的重要資料,經過對這些監(jiān)控記錄很可能能夠找出故障的原因。 監(jiān)控體系的作用便是將前史經驗、經驗轉化為一些數據參數,然后采集數據中心機房里的各種數據信息進行對比,假如發(fā)現異常,就及時給出告警。數據越豐富,監(jiān)控體系的功能就越強大。
總結:
不要以為一個數據中心機房不是部署了監(jiān)控體系就能夠高枕無憂了,任何的體系都有漏洞,何況是監(jiān)控體系,所以數據中心機房運維人員還要在日常的作業(yè)中,多檢查,多分析,及時發(fā)現隱患,假如監(jiān)控體系未能發(fā)現,那么想辦法將這些隱患的判斷加到監(jiān)控體系中,使監(jiān)控體系越來越完善,決不能允許相同的錯誤,連續(xù)犯兩次。
關注我們