很多人可能隻是了解過DevOps,AIOps可能沒怎麼去了解,今天主要介紹下AIOps的概念、目标、原則和能力分級。
AIOps,即 Artificial Intelligence for IT Operations,智能運維,将人工智能應用于運維領域,基于已有的運維數據(日志、監控信息、應用信息等),通過機器學習的方式來進一步解決自動化運維沒辦法解決的問題。
早期的運維工作大部分是由運維人員手工完成的,這被稱為手工運維或人肉運維。這種落後的生産方式,在互聯網業務快速擴張、人力成本高企的時代,難以維系。
AIOps,通俗的講,是對規則的AI化,即将人工總結運維規則的過程變為自動學習的過程。
具體而言,是對我們平時運維工作中長時間積累形成的自動化運維和監控等能力,将其規則配置部分,進行自學習的“去規則化”改造,最終達到終極目标:“有AI調度中樞管理的,質量、成本、效率三者兼顧的無人值守運維,力争所運營系統的綜合收益最大化”。
AIOps 目标利用大數據、機器學習和其他分析技術,通過預防預測、個性化和動态分析,直接和間接增強IT業務的相關技術能力,實現所維護産品或服務的更高質量、合理成本及高效支撐。
AIOps 指導原則AIOps 能力分級
AIOps的建設可以先由無到局部單點探索、再到單點能力完善,形成解決某個局部問題的運維AI“學件”,再有多個具有AI能力的單運維能力點或學件組合成一個智能的運維流程,如智能化的監控預測及告警,免幹預的自動化擴縮容,免幹預的性能調優、免幹預的成本組成調優等。
具體可描述為5級:
1)開始嘗試應用AI能力,還無較成熟單點應用 2)具備單場景的AI運維能力,可以初步形成供内部使用的學件 3)有由多個單場景AI運維模塊串聯起來的流程化AI運維能力,可以對外提供可靠的運維AI學件 4)主要運維場景均已實現流程化免幹預AI運維能力,可以對外提供可靠的AIOps服務。 5) 有核心中樞AI,可以在成本、質量、效率間從容調整,達到業務不同生命周期對三個方面不同的指标要求,可實現多目标下的最優或按需最優。
AIOps 是 企業級 DevOps 在運維(技術運營)側的高階實現。
AIOps 和 DevOps 兩者并不沖突,企業級 DevOps 涵括包括運維在内的整個軟件生命周期。
自動化做devops,專業化做Dataops,智能化做AIOps!
AIOps是一項十年以上的大項目,值得我們去探索落地實踐,有興趣的朋友可以深入研究下。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!