網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 滾動資訊 > 正文

華云大咖說 | 大型分布式監(jiān)控系統(tǒng)建設(shè)經(jīng)驗

大型企業(yè)在建立信息系統(tǒng)時,往往很注重硬件體系建設(shè)以及應(yīng)用體系建設(shè),在投入大量的硬件資源、人力資源,并建立了多套應(yīng)用系統(tǒng)和運維系統(tǒng)后,卻達不到預(yù)期的效果,甚至隨著信息化架構(gòu)規(guī)模的日益擴大,工作量劇烈攀升,問題頻發(fā),導(dǎo)致信息化部門疲于應(yīng)付解決各種問題而無法進行更有效的管理和服務(wù)升級。

因此,在信息化體系建設(shè)中,監(jiān)控運維體系必須作為重點模塊進行規(guī)劃建設(shè),為后續(xù)的業(yè)務(wù)運行狀態(tài)監(jiān)測、故障分析處理、數(shù)據(jù)展示、數(shù)據(jù)分析、業(yè)務(wù)優(yōu)化等實現(xiàn)基礎(chǔ)的監(jiān)控保障和充足的數(shù)據(jù)支撐。

本期華云大咖說,邀請到華云數(shù)據(jù)高級售前顧問周宇,暢談大型企業(yè)在信息化建設(shè)和運維中常遇的問題,并進行經(jīng)驗分享。

核心觀點:

1.企業(yè)成長過程中,隨著業(yè)務(wù)規(guī)模的增加,運維體系也必須升級到標(biāo)準(zhǔn)的多級架構(gòu),比如,L0級的服務(wù)臺或者遠程監(jiān)控中心提供7*24熱線及遠程支持服務(wù)、遠程監(jiān)控及跟蹤服務(wù);L1級初級工程師團隊處理標(biāo)準(zhǔn)服務(wù)和故障;L2級專業(yè)的工程師團隊處理復(fù)雜需求和故障,再依托L3級專家團隊和外部廠商團隊來解決更深層次的服務(wù)需求和故障問題。

2.大型集團型企業(yè)需要全方位的基礎(chǔ)設(shè)施和業(yè)務(wù)監(jiān)控體系,并且監(jiān)控體系必須考慮到集團企業(yè)的分散特性,必須支持分布式部署,同時對報表、大屏、告警關(guān)聯(lián)、流程整合等一系列增強功能也必須考慮在內(nèi)。

3.監(jiān)控平臺要具備基本的監(jiān)控能力:硬件監(jiān)控、網(wǎng)絡(luò)設(shè)備監(jiān)控、存儲監(jiān)控、鏈路監(jiān)控、云監(jiān)控、動環(huán)、主機監(jiān)控、中間件監(jiān)控、數(shù)據(jù)庫監(jiān)控、容器監(jiān)控。

4.當(dāng)企業(yè)業(yè)務(wù)系統(tǒng)發(fā)生故障時,監(jiān)控系統(tǒng)應(yīng)該能夠分析發(fā)生了什么事情,什么時間發(fā)生的,對應(yīng)哪個職能部門,影響范圍多大,核心故障在哪里,而不是按時間順序挨個處理告警,花費大量時間解決外圍問題。

5.在數(shù)據(jù)展示方面,要考慮提供多種視角,比如需要滿足公司領(lǐng)導(dǎo)層、運維管理層、運維一線人員等多種職能組的不同需求,因此需要建立多套不同視角維度的數(shù)據(jù)展示模塊。

6.總的來說,大型分布式監(jiān)控系統(tǒng)建設(shè)應(yīng)緊密結(jié)合業(yè)務(wù),注重監(jiān)控對象和告警的業(yè)務(wù)邏輯關(guān)聯(lián)性,并逐步向智能運維邁進,為企業(yè)解決實際監(jiān)控難題,規(guī)劃整體運維平臺,避免重復(fù)建設(shè),助力企業(yè)加快實現(xiàn)數(shù)字化轉(zhuǎn)型。

【本文資訊為廣告信息,不代表本網(wǎng)立場。】

[責(zé)任編輯:user1]