“維基百科”是這樣定義事件管理(Event Management) 的,事件管理是項(xiàng)目管理在大型活動(dòng)創(chuàng)新和發(fā)展中的應(yīng)用,如節(jié)日、會(huì)議、慶典、婚禮、聚會(huì)、音樂會(huì)、集會(huì)等。這里面包含了品牌研究、目標(biāo)受眾確定、活動(dòng)概念設(shè)計(jì),以及活動(dòng)實(shí)際發(fā)生前的技術(shù)協(xié)調(diào)。
如果我們把這個(gè)概念投射到 IT領(lǐng)域,事件管理就是為了實(shí)現(xiàn)某個(gè)特定的業(yè)務(wù)訴求,將事務(wù)狀態(tài)變化信息與人員響應(yīng)進(jìn)行聯(lián)動(dòng)的一系列過程。
事件管理的目標(biāo)是檢測(cè)并記錄這些事務(wù)狀態(tài)的變更,以便獲得對(duì)業(yè)務(wù)風(fēng)險(xiǎn)和商業(yè)機(jī)會(huì)的完全可見性。例如:用戶登錄,轉(zhuǎn)賬失敗,業(yè)務(wù)系統(tǒng)版本升級(jí),數(shù)據(jù)備份,服務(wù)器維護(hù)完成,這些都是團(tuán)隊(duì)需要跟蹤的變更。盡管這些變更并不直接反映服務(wù)質(zhì)量的下降,但它們可能會(huì)暗示存在影響用戶體驗(yàn)的潛在風(fēng)險(xiǎn)。因此,全面的收集事件信息,確定響應(yīng)優(yōu)先級(jí),并采取相應(yīng)的措施,就變得非常關(guān)鍵。
隨著商業(yè)模式和 IT支撐環(huán)境復(fù)雜性的增加,團(tuán)隊(duì)需要管理的事件規(guī)模也呈指數(shù)級(jí)增長(zhǎng),但管理事件的人員數(shù)量卻沒有得到增加?,F(xiàn)在,許多團(tuán)隊(duì)每天都在和成千上萬甚至數(shù)百萬事件打交道,受限于資源投入,幾乎不可能有效地將高價(jià)值信息與噪音從海量事件中分離出來,以洞察風(fēng)險(xiǎn)和機(jī)會(huì)。
而這正是事件管理解決方案的核心能力所在。事件管理平臺(tái)通過集成能力對(duì)接和匯聚事件,過濾噪音,識(shí)別風(fēng)險(xiǎn),并通知適當(dāng)人員進(jìn)行相應(yīng)的操作。隨著企業(yè)數(shù)字化轉(zhuǎn)型的加速和 IT 交付風(fēng)險(xiǎn)的增高,通過集成化的事件管理平臺(tái)提升事件和關(guān)聯(lián)行動(dòng)間的處理效率,比以往任何時(shí)候都更加重要。
事件相關(guān)概念的定義
在深入事件管理這個(gè)話題之前,我們需要對(duì)三個(gè)概念進(jìn)行簡(jiǎn)要的剖析,以便后續(xù)更準(zhǔn)確的理解事件管理的含義和價(jià)值。
這三個(gè)概念分別是Event(事件),Alert(告警)和Incident(事件集)。其中,事件和告警比較容易理解和區(qū)分,但是Event和Incident在中文語境中通常都被翻譯為事件,容易造成混淆,為了對(duì)二者加以區(qū)分,我們將Event稱作事件,Incident稱作事件集。下面是這三個(gè)名詞的具體定義和說明:
Event 事件,是事務(wù)狀態(tài)在某個(gè)時(shí)間點(diǎn)的客觀描述,沒有好壞之分。它由一個(gè)或多個(gè)相關(guān)指標(biāo)的狀態(tài)信息組成,這些指標(biāo)狀態(tài)可被監(jiān)控、分類和變更。例如:2020/5/6 13:27:34,10.1.1.1,磁盤空間利用率為51%。2020/5/1 09:29:32,13900000000,充值100元成功。
Alert 告警,是主觀判定的事務(wù)異常狀態(tài)的描述。它由監(jiān)控(或其他)工具產(chǎn)生,反映事物指標(biāo)的異常。例如:2020/5/6 17:25:18,10.1.1.1,磁盤空間利用率為64%,高于60%,警告級(jí)別告警。一般來說,事件和告警本身并不影響客戶體驗(yàn)和業(yè)務(wù)運(yùn)行,不需要人員進(jìn)行介入處理。
Incident 事件集,是由一個(gè)或多個(gè)相關(guān)事件和告警組成,反映業(yè)務(wù)運(yùn)行或用戶體驗(yàn)問題。例如:我們將10.1.1.1服務(wù)器的幾個(gè)磁盤相關(guān)告警(磁盤空間利用率高于60%,磁盤空間利用率高于80%,磁盤空間已滿)組成一個(gè)事件集,這個(gè)事件集反映了業(yè)務(wù)服務(wù)質(zhì)量持續(xù)下降,影響了客戶體驗(yàn)。事件可能不是事件集,因?yàn)槭录苍S并沒有任何實(shí)際的客戶影響,但是所有事件集都是事件,因?yàn)槭录峁┝苏诎l(fā)生的事情集的原始上下文。
事件管理最高效的方式是以人為中心,將人和反映業(yè)務(wù)故障的事件集進(jìn)行結(jié)合,而不是人員將時(shí)間浪費(fèi)在處理海量的郵件和電話轟炸上,在大量的原始事件中發(fā)現(xiàn)和診斷問題。
為什么事件管理 如此 重要
雖然我們的企業(yè)準(zhǔn)備了非常詳盡的業(yè)務(wù)連續(xù)性保障計(jì)劃和應(yīng)急預(yù)案,但是業(yè)務(wù)環(huán)境復(fù)雜度的不斷攀升和行業(yè)競(jìng)爭(zhēng)的進(jìn)一步加劇,對(duì)業(yè)務(wù)風(fēng)險(xiǎn)和商業(yè)機(jī)會(huì)的應(yīng)對(duì)效率也提出了更高的要求。收集更加全面的信息,運(yùn)用智能化的手段,幫助團(tuán)隊(duì)實(shí)時(shí)評(píng)估風(fēng)險(xiǎn)和收益,提升反應(yīng)速度和準(zhǔn)確性,就變得至關(guān)重要。事件管理平臺(tái)運(yùn)用事件流處理和人工智能技術(shù)將這一過程自動(dòng)化,充分挖掘海量事件中的核心高價(jià)值信息,并將風(fēng)險(xiǎn)和機(jī)會(huì)與人員進(jìn)行關(guān)聯(lián),運(yùn)用現(xiàn)代化的通訊和協(xié)作工具,提供更加便捷、全面、準(zhǔn)確的事件評(píng)估和響應(yīng)。
事件管理的價(jià)值還包括:
更主動(dòng)的風(fēng)險(xiǎn)防范
更快速的業(yè)務(wù)恢復(fù)
更高效的團(tuán)隊(duì)協(xié)作
更敏捷的實(shí)時(shí)響應(yīng)
事件管理可幫助組織定義檢測(cè)和催化對(duì)任何會(huì)影響服務(wù)管理和性能的事件的正確正確響應(yīng)的外觀。
事件管理的核心能力
事件是對(duì)事務(wù)狀態(tài)的客觀描述,有效的事件管理計(jì)劃和戰(zhàn)略是一個(gè)跨場(chǎng)景、端到端的處理流程,能夠降低或消除風(fēng)險(xiǎn)帶來的影響,挖掘和拓展新的商業(yè)機(jī)會(huì),提升團(tuán)隊(duì)的響應(yīng)速度,并優(yōu)化產(chǎn)出結(jié)果。
事件管理包括以下三個(gè)方面能力:
集成化
收集和獲取更加全面的事件數(shù)據(jù),是更加精準(zhǔn)的進(jìn)行風(fēng)險(xiǎn)評(píng)估和商機(jī)挖掘的前提。與企業(yè)數(shù)字化生態(tài)廣泛的建立連接,實(shí)現(xiàn)實(shí)時(shí)的事件接收和消息推送,確保事件在系統(tǒng)和人員間進(jìn)行快速的流轉(zhuǎn)。
智能化
結(jié)合豐富的上下文數(shù)據(jù),主動(dòng)對(duì)風(fēng)險(xiǎn)和機(jī)會(huì)進(jìn)行分類、篩選、檢測(cè),并將該信息與資產(chǎn)、人員相關(guān)聯(lián),在損失真正造成前預(yù)判,幫助團(tuán)隊(duì)成員準(zhǔn)確的掌握業(yè)務(wù)狀態(tài)和威脅,避免誤漏,更好的進(jìn)行決策。
流程化
無需大量人工參與,自動(dòng)化的處理流程幫助團(tuán)隊(duì)在風(fēng)險(xiǎn)和機(jī)會(huì)尚未確認(rèn)前自主開展工作。在問題處理過程中,事件按照既定的分派策略和通知方式在團(tuán)隊(duì)成員中自動(dòng)進(jìn)行流轉(zhuǎn),進(jìn)一步提升應(yīng)對(duì)效率,確保行動(dòng)的有效性。
典型的事件管理 流程
1. 事件接入 事件和告警由特定的工具檢測(cè)生成,并集成到統(tǒng)一的處理平臺(tái)。
2.事件 處理 針對(duì)不同事件源產(chǎn)生的事件,通過數(shù)據(jù)格式化,自定義數(shù)據(jù)提取和數(shù)據(jù)內(nèi)容豐富進(jìn)行數(shù)據(jù)治理,并將重復(fù)和冗余的噪音剔除,再通過規(guī)則或算法生成反映業(yè)務(wù)問題的事件集。
3.事件 分派 根據(jù)事件集的特征,將通知在第一時(shí)間動(dòng)態(tài)路由到個(gè)人、組、協(xié)作團(tuán)隊(duì),并通過流程化管理確保事件信息和人員間無縫銜接。
4. 事件 響應(yīng) 事件處理人員根據(jù)自身的條件,在PC端、移動(dòng)端、協(xié)作工具中對(duì)事件進(jìn)行認(rèn)領(lǐng)、指派、協(xié)同、轉(zhuǎn)發(fā)、關(guān)閉等操作。
5. 事件 解決 在問題解決后,將處理過程記錄到事件解決方案中,沉淀知識(shí)以指導(dǎo)后續(xù)類似場(chǎng)景的處理。
事件管理的應(yīng)用場(chǎng)景
智能運(yùn)維 AIOps
智能事件管理整合 IT 監(jiān)控工具告警信息,智能化降低95%告警噪音,自動(dòng)化事件管理流程,加強(qiáng)團(tuán)隊(duì)協(xié)作,加速故障定位和修復(fù),將業(yè)務(wù)影響降到最低。
安全信息事件管理 SIEM
匯聚企業(yè)內(nèi)、外部安全事件,通過規(guī)則引擎和事件流處理引擎,實(shí)時(shí)洞察安全風(fēng)險(xiǎn),并利用靈活的事件處置流程,幫助團(tuán)隊(duì)主動(dòng)應(yīng)對(duì)安全事故。
物聯(lián)網(wǎng)應(yīng)用 Internet of Things
將智能設(shè)備、傳感器的事件信息在物聯(lián)網(wǎng)邊緣節(jié)點(diǎn)和核心節(jié)點(diǎn)實(shí)時(shí)進(jìn)行匯總、加工,通過事件流式處理,捕獲和發(fā)現(xiàn)新的數(shù)據(jù)模型,挖掘更多高價(jià)值應(yīng)用場(chǎng)景。
業(yè)務(wù)分析 Business Analysis
打通業(yè)務(wù)運(yùn)營(yíng)和 IT 支撐的數(shù)據(jù)邊界,從系統(tǒng)中實(shí)時(shí)獲取更多的業(yè)務(wù)數(shù)據(jù),幫助團(tuán)隊(duì)對(duì)影響業(yè)務(wù)的事件做出快速、正確的反應(yīng)。在危機(jī)時(shí)刻,掌控混亂局面。
【版權(quán)聲明】凡本站未注明來源為"中國(guó)科學(xué)網(wǎng)"的所有作品,均轉(zhuǎn)載、編譯或摘編自其它媒體,轉(zhuǎn)載、編譯或摘編的目的在于傳遞更多信息,并不代表本站及其子站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。其他媒體、網(wǎng)站或個(gè)人轉(zhuǎn)載使用時(shí)必須保留本站注明的文章來源,并自負(fù)法律責(zé)任。 中國(guó)科學(xué)網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。
【特別提醒】如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。郵箱 biz@minimouse.com.cn