基礎(chǔ)設(shè)施監(jiān)控的演變
基礎(chǔ)設(shè)施監(jiān)控是一個(gè)整理和分析來(lái)自IT環(huán)境所有組件的度量、跟蹤、日志和其他遙測(cè)數(shù)據(jù)的過(guò)程,以提供對(duì)可用性和性能的可操作洞察。然而,隨著云環(huán)境的復(fù)雜性和動(dòng)態(tài)性的增加,實(shí)現(xiàn)有效的監(jiān)控變得更具挑戰(zhàn)性。
例如,在多云環(huán)境中,每個(gè)平臺(tái)都附帶一個(gè)來(lái)自公共云提供商的原生監(jiān)控解決方案,該解決方案只提供對(duì)其自身基礎(chǔ)設(shè)施組件的可見(jiàn)性。因此,組織必須拼湊各種工具,這會(huì)造成復(fù)雜性并妨礙整個(gè)堆棧中的端到端可見(jiàn)性。
有了正確的技術(shù)和配置,基礎(chǔ)設(shè)施監(jiān)控將改變游戲規(guī)則。它幫助團(tuán)隊(duì)發(fā)現(xiàn)和分析趨勢(shì),并在潛在問(wèn)題破壞用戶體驗(yàn)或違反服務(wù)級(jí)別協(xié)議(SLA)之前標(biāo)記它們。它還可以支持A/B測(cè)試,這有助于團(tuán)隊(duì)確定性能和用戶體驗(yàn)的最佳基礎(chǔ)設(shè)施設(shè)置。高度自動(dòng)化的監(jiān)控解決方案有助于團(tuán)隊(duì)減少手動(dòng)流程,隨著基礎(chǔ)設(shè)施的發(fā)展可以輕松擴(kuò)展,最重要的是,專(zhuān)注于創(chuàng)新,而不是修復(fù)bug。
以下是七個(gè)優(yōu)秀實(shí)踐,可幫助基礎(chǔ)設(shè)施團(tuán)隊(duì)設(shè)置和優(yōu)化云原生監(jiān)控功能。
1. 盡可能實(shí)現(xiàn)自動(dòng)化
對(duì)于大型動(dòng)態(tài)環(huán)境,使用高度自動(dòng)化的基礎(chǔ)設(shè)施監(jiān)控解決方案是關(guān)鍵。監(jiān)控功能的手動(dòng)配置和儀表化是令人望而卻步的勞動(dòng)密集型任務(wù)。團(tuán)隊(duì)發(fā)現(xiàn)無(wú)法對(duì)其基礎(chǔ)設(shè)施的一些部分進(jìn)行檢測(cè),并且難以保持對(duì)代理的監(jiān)控處于最新?tīng)顟B(tài)。
另一方面,自動(dòng)部署、自動(dòng)配置和自動(dòng)基線使組織能夠擴(kuò)大可以捕獲的度量范圍,消除盲點(diǎn),并在云原生基礎(chǔ)設(shè)施堆棧中實(shí)現(xiàn)端到端的可觀察性。這將帶來(lái)更高質(zhì)量的監(jiān)控,并生成更精確的上下文洞察。通過(guò)增強(qiáng)數(shù)據(jù),團(tuán)隊(duì)可以更快地解決問(wèn)題,從而獲得更好的客戶體驗(yàn)。減少人為干預(yù)可以騰出時(shí)間讓團(tuán)隊(duì)專(zhuān)注于更高效的任務(wù),從而加快轉(zhuǎn)型和現(xiàn)代化計(jì)劃。
2. 花時(shí)間配置警報(bào)
概述需要哪種警報(bào)是值得的,這樣就可以盡快發(fā)現(xiàn)問(wèn)題。如果沒(méi)有可靠的警報(bào)配置,團(tuán)隊(duì)將無(wú)法確定問(wèn)題并確定多個(gè)警報(bào)是否與同一問(wèn)題相關(guān)。警報(bào)特指性可提高準(zhǔn)確性并減少誤報(bào)。周密的警報(bào)機(jī)制可以縮短響應(yīng)時(shí)間,幫助團(tuán)隊(duì)更快地解決根本原因,提高正常運(yùn)行時(shí)間。
為了獲得最大的效率,自動(dòng)基線功能可以顯著減少警報(bào)配置的需要,能夠自動(dòng)消除誤報(bào),執(zhí)行自動(dòng)根本原因分析,并根據(jù)業(yè)務(wù)影響確定警報(bào)優(yōu)先級(jí)。
3. 創(chuàng)建優(yōu)先級(jí)
根據(jù)業(yè)務(wù)影響對(duì)警報(bào)進(jìn)行分組有助于團(tuán)隊(duì)首先將精力集中在最嚴(yán)重的問(wèn)題上。這種方法消除了在對(duì)通知重要性的猜測(cè),從而節(jié)省了團(tuán)隊(duì)的時(shí)間和壓力。還可以將警報(bào)定向到不同的頻道。
例如,一家公司可以將其IT服務(wù)管理(ITSM)系統(tǒng)配置為通過(guò)SMS向待命工程師的智能手機(jī)發(fā)送高優(yōu)先級(jí)警報(bào),并通過(guò)電子郵件發(fā)送低優(yōu)先級(jí)問(wèn)題。對(duì)于擁有24小時(shí)待命工程師的企業(yè),優(yōu)先順序可以減少非工作時(shí)間的警報(bào)疲勞和團(tuán)隊(duì)中斷。
4. 設(shè)置自定義儀表板
通過(guò)創(chuàng)建特定于角色的儀表板,確保合適的人員能夠訪問(wèn)所需的監(jiān)控?cái)?shù)據(jù)。組織內(nèi)的不同團(tuán)隊(duì)可能需要出于不同的目的查看基礎(chǔ)設(shè)施監(jiān)控報(bào)告。例如,ITOps工程師可能與IT安全團(tuán)隊(duì)、營(yíng)銷(xiāo)部門(mén)和業(yè)務(wù)主管擁有不同的關(guān)鍵績(jī)效指標(biāo)(KPI)。
確定利益相關(guān)者認(rèn)為哪些見(jiàn)解最有價(jià)值,哪些見(jiàn)解不必要。為僅顯示相關(guān)數(shù)據(jù)的每個(gè)組設(shè)置自定義儀表板。(但是,關(guān)鍵是所有儀表盤(pán)的基礎(chǔ)數(shù)據(jù)都是一致的,并且基于相同的數(shù)據(jù)模型。)
5. 測(cè)試系統(tǒng)
如果不徹底測(cè)試系統(tǒng),大多數(shù)企業(yè)永遠(yuǎn)不會(huì)啟動(dòng)系統(tǒng)或部署重大更改?;A(chǔ)設(shè)施監(jiān)控也不例外。確定最可能的場(chǎng)景并設(shè)計(jì)測(cè)試框架,以確?;A(chǔ)設(shè)施監(jiān)控解決方案按預(yù)期執(zhí)行。最安全的方法是在指定的測(cè)試環(huán)境中進(jìn)行測(cè)試,以防止生產(chǎn)和客戶受到影響。然后,團(tuán)隊(duì)可以微調(diào)設(shè)置和警報(bào)配置,以確保一切正常。
6. 定期檢查度量和KPI
目標(biāo)不斷演變,因此定期審查指標(biāo)以確保基礎(chǔ)設(shè)施監(jiān)控解決方案生成每個(gè)利益相關(guān)者所需的數(shù)據(jù)和洞察至關(guān)重要。評(píng)估KPI并與團(tuán)隊(duì)合作以確定未來(lái)要建立的新基準(zhǔn)也是有益的。隨著一個(gè)組織在數(shù)字化轉(zhuǎn)型過(guò)程中的進(jìn)一步發(fā)展,新的基礎(chǔ)設(shè)施盲點(diǎn)將出現(xiàn)。定期的度量審查可以避免無(wú)意的疏忽,并確保在整個(gè)基礎(chǔ)設(shè)施堆棧中保持完全的可見(jiàn)性。
7. 利用供應(yīng)商專(zhuān)有技術(shù)和資源
難以完善其監(jiān)控設(shè)置或缺乏內(nèi)部專(zhuān)有技術(shù)或經(jīng)驗(yàn)的組織可以選擇供應(yīng)商提供支持。供應(yīng)商專(zhuān)家將具備行業(yè)最佳實(shí)踐方面的專(zhuān)業(yè)知識(shí),并熟悉團(tuán)隊(duì)正在解決的問(wèn)題。利用供應(yīng)商的專(zhuān)業(yè)知識(shí)可以幫助團(tuán)隊(duì)更快地實(shí)現(xiàn)其監(jiān)控目標(biāo),同時(shí)提高內(nèi)部技能。
一種可擴(kuò)展的基礎(chǔ)設(shè)施監(jiān)控方法
隨著企業(yè)繼續(xù)向現(xiàn)代多云環(huán)境過(guò)渡,最大限度地延長(zhǎng)正常運(yùn)行時(shí)間和彈性對(duì)于確保業(yè)務(wù)連續(xù)性和客戶滿意度比以往任何時(shí)候都更為重要。將正確的監(jiān)控解決方案落實(shí)到位,以實(shí)現(xiàn)基礎(chǔ)設(shè)施性能的明確戰(zhàn)略目標(biāo),可以讓團(tuán)隊(duì)獲得最大的成功。
對(duì)許多人來(lái)說(shuō),最有效的方法是實(shí)現(xiàn)一個(gè)統(tǒng)一的平臺(tái),該平臺(tái)可以在一個(gè)地方為所有云環(huán)境提供可觀察性。這有助于團(tuán)隊(duì)更有效地協(xié)作并充分利用時(shí)間。通過(guò)將AIOps驅(qū)動(dòng)的自動(dòng)化與這些功能結(jié)合起來(lái),組織可以設(shè)計(jì)一個(gè)可擴(kuò)展的基礎(chǔ)設(shè)施監(jiān)控框架——該框架將隨著業(yè)務(wù)的發(fā)展而發(fā)展,為創(chuàng)新和進(jìn)一步轉(zhuǎn)型創(chuàng)造更多空間。
田鑫,專(zhuān)業(yè)的企業(yè)組網(wǎng)服務(wù)商,致力于為企業(yè)提供企業(yè)組網(wǎng)(SD-WAN、MPLS、云互聯(lián)),業(yè)務(wù)云化、數(shù)據(jù)中心、網(wǎng)絡(luò)安全、行業(yè)IT解決方案等相關(guān)服務(wù)。
更多相關(guān)內(nèi)容推薦:
多云戰(zhàn)略:云發(fā)展的必由之路
多云戰(zhàn)略日益受到歡迎,企業(yè)怎樣制定有效的多云策略?
企業(yè)考慮使用多云前需要了解什么?