云服務(wù)中斷僅指云基礎(chǔ)架構(gòu)服務(wù)無(wú)法使用的持續(xù)時(shí)間。根據(jù)商定的SLA指標(biāo),不可用性還可能指服務(wù)的性能不足。例如,中斷可能僅部分影響數(shù)據(jù)中心的事件可能導(dǎo)致供應(yīng)商執(zhí)行必要的維護(hù)和恢復(fù)措施。在根據(jù)商定的SLA標(biāo)準(zhǔn)完全恢復(fù)服務(wù)之前,可能會(huì)將其視為最終用戶(hù)的停機(jī)時(shí)間。
云中斷的常見(jiàn)原因
云中斷可能是由云供應(yīng)商控制范圍內(nèi)外的一系列原因引起的。以下列表簡(jiǎn)要介紹了云供應(yīng)商考慮的問(wèn)題,以確保服務(wù)始終在SLA上提供足夠的可接受性:
停電:導(dǎo)致云服務(wù)中斷的最常見(jiàn)原因之一是無(wú)法獲得為底層數(shù)據(jù)中心供電的電能。云供應(yīng)商固有地大規(guī)模運(yùn)營(yíng) - 單個(gè)數(shù)據(jù)中心可能消耗10到100兆瓦的電力,而這些數(shù)據(jù)中心通常依賴(lài)于由第三方獨(dú)立運(yùn)營(yíng)的國(guó)家電網(wǎng)或發(fā)電廠。這使得充足電力的持續(xù)可用性成為數(shù)據(jù)中心公司面臨的挑戰(zhàn),特別是因?yàn)榭焖僭鲩L(zhǎng)和可擴(kuò)展的市場(chǎng)需求需要可擴(kuò)展的電源,否則只能以有限的數(shù)量提供。
網(wǎng)絡(luò)安全:分布式拒絕服務(wù)(DDoS)等網(wǎng)絡(luò)攻擊會(huì)導(dǎo)致數(shù)據(jù)中心因傳入流量而過(guò)載,從而阻止合法用戶(hù)通過(guò)相同的網(wǎng)絡(luò)通道訪(fǎng)問(wèn)服務(wù)。盡管有適當(dāng)?shù)谋Wo(hù)系統(tǒng),但黑客傾向于利用隱藏的漏洞,這些漏洞要么觸發(fā)保護(hù)機(jī)制,將服務(wù)與合法用戶(hù)隔離,泄漏數(shù)據(jù)或完全關(guān)閉服務(wù)。
人為錯(cuò)誤:盡管存在嚴(yán)格的協(xié)議和系統(tǒng)以避免此類(lèi)無(wú)法預(yù)料的問(wèn)題,但單個(gè)不正確的命令可能會(huì)降低整個(gè)IT基礎(chǔ)架構(gòu)服務(wù)的負(fù)擔(dān)。即使是最大的云供應(yīng)商也會(huì)發(fā)生這種情況,如2017年全球互聯(lián)網(wǎng)因AWS數(shù)據(jù)中心設(shè)施出現(xiàn)人為錯(cuò)誤而中斷時(shí)所見(jiàn)。雖然系統(tǒng)能夠盡早檢測(cè)到異常行為,但許多受影響的數(shù)據(jù)中心的基礎(chǔ)架構(gòu)需要完全恢復(fù)和重新啟動(dòng)。
軟件和技術(shù)問(wèn)題:云基礎(chǔ)架構(gòu)由復(fù)雜的硬件和軟件技術(shù)系統(tǒng)組成。在為各種規(guī)模和垂直行業(yè)的組織提供動(dòng)力的企業(yè)級(jí)數(shù)據(jù)中心中,可能會(huì)出現(xiàn)毛刺和錯(cuò)誤。這些技術(shù)問(wèn)題可能會(huì)被忽視或被忽視,直到它轉(zhuǎn)化為影響最終用戶(hù)的實(shí)際服務(wù)事件。當(dāng)這些問(wèn)題的解決方案不明顯或不適用于立即解決問(wèn)題時(shí),該服務(wù)可能仍處于停機(jī)狀態(tài)。
網(wǎng)絡(luò)問(wèn)題:云供應(yīng)商可能與長(zhǎng)途運(yùn)營(yíng)通信網(wǎng)絡(luò)的電信服務(wù)提供商和政府組織合作。與組織之外的網(wǎng)絡(luò)相關(guān)的問(wèn)題,尤其是跨境的網(wǎng)絡(luò),可能遠(yuǎn)遠(yuǎn)超出服務(wù)提供商的控制范圍,尤其是在解決連接問(wèn)題方面。在這種情況下,云供應(yīng)商和客戶(hù)依賴(lài)其電信合作伙伴來(lái)確保服務(wù)得以恢復(fù)。為了解決這一限制,大多數(shù)大型云供應(yīng)商在多個(gè)國(guó)家/地區(qū)運(yùn)營(yíng),能夠在地理位置不同的數(shù)據(jù)中心之間動(dòng)態(tài)平衡工作負(fù)載。這使得公司可以繼續(xù)向最終用戶(hù)提供服務(wù),即使在解決網(wǎng)絡(luò)問(wèn)題超出其內(nèi)部控制范圍時(shí)也是如此。
維護(hù):云供應(yīng)商負(fù)責(zé)其IT基礎(chǔ)架構(gòu)的運(yùn)營(yíng),維護(hù)和管理。最終用戶(hù)只需為所消費(fèi)的服務(wù)付費(fèi),而供應(yīng)商則持續(xù)投資于服務(wù)改進(jìn)。這包括計(jì)劃和非計(jì)劃的維護(hù)和升級(jí)。維護(hù)過(guò)程可能需要服務(wù)中斷,跨數(shù)據(jù)中心傳輸工作負(fù)載或需要完全重新啟動(dòng)系統(tǒng)的常規(guī)修復(fù)。在此期間,該服務(wù)可能仍然無(wú)法供最終用戶(hù)使用,并被視為云中斷。