tft每日頭條

 > 生活

 > 智能化網絡運維方案

智能化網絡運維方案

生活 更新时间:2025-03-21 21:41:36

智能化網絡運維方案(實戰夯實數字化轉型服務底座)1

北京銀行系統運營中心副總經理(主持) 宗勇濤

今年年初,央行發布的《金融科技發展規劃(2022-2025年)》提出了“建立健全金融數據中心智能化運維機制,加強多場景協同聯動、多節點一體管控,提升節點感知、異常發現和故障預測能力,降低人工操作風險,推動運維管理模式轉型升級。”的指導意見。可以看出,推動數據中心智能化運維是保障金融業務穩定持續運行的重要一環。近年來,北京銀行不斷加速數字化轉型,積極投入智能化運維體系建設,探索實踐應用網絡協同一體化運維的新模式,旨在為“數字京行”建設和用戶體驗升級構築堅實的數字底座。

金融數字化轉型中的運維挑戰

雲計算、大數據、虛拟化等金融科技在不斷加速應用,同時銀行業務也在快速發展,使得IT架構日益複雜化,引入的運維平台和工具越來越多,這些平台之間如何實現能力和數據的互通,從而提高整體運維效率,是IT運維團隊面臨的挑戰。

一方面,北京銀行線上業務迅猛發展,業務的互訪關系錯綜複雜,一筆交易完成可能涉及多個業務系統,如何端到端實時感知業務交易的質量,進而區分每段交易在各個應用流轉中的質量,這對應用可視化運維提出了新的訴求。

另一方面,随着分布式、大數據業務的興起,數據中心東西向流量占比越來越大,分布式“多打一”流量極易引起微突發等問題,傳統監控手段難以察覺。分布式架構帶來網絡設備成倍增加,業務穩定運行要求網絡隐患可提前識别、故障可快速定位,這對網絡智能運維帶來了新的挑戰。

第三,一旦業務出現訪問慢等問題,通常需要多部門投入定位,應用和網絡人員需要反複溝通,特别是對于偶發性的業務投訴類問題,由于交易過程涉及的應用系統多、網絡路徑長,需要應用和網絡更自動化、智能化地聯合運維,這就對應用和網絡系統間能力互通、數據流通提出了新的訴求。

北京銀行已建成應用性能分析平台和網絡運維平台,為了使運維工作更加高效、自動化、智能化,達到縮短業務問題定位時長、支撐業務穩定持續運行的目的,經過充分研讨和驗證,決定在提升應用和網絡運維智能化的同時,首創打破兩者的數據邊界,實現業務流量從應用到網絡的端到端路徑還原,可以從應用交易視圖一鍵下探到對應的網絡路徑和路況,使得業務問題的定界更加清楚、定位更加簡單。

探索智能運維經驗分享

近期北京銀行運維團隊在自動化和智能化方面做了一些嘗試,希望借助新技術逐步夯實運維基礎,聯合華為共同探讨一系列關于數據中心智能化運維演進的思路,并通過相關實踐,尋找保障業務安全生産的有效途徑。

1.多源統一,使能全鍊路應用性能監控

企業數字化轉型須要以業務為中心,線上業務迅猛發展,業務新老架構并行,如何對不同的業務進行全面的質量監控、真實的關系還原、實時的故障告警、快速的故障定位成為IT管理部門面臨的難題之一。

北京銀行采用旁路技術,通過端口鏡像捕獲網絡流量數據,可以從傳統環境、虛拟化環境、雲環境以及容器環境中實時地、完整地獲取業務流數據,從而解析建立實時統一的業務視圖,直觀展現應用服務的業務邏輯、依賴關系、服務運行質量、發生的告警、并提供自動故障分析功能,可呈現每筆交易的業務路徑并區分每個應用節點上的時間消耗,找到性能瓶頸,在業務提供服務的全過程中進行運維保障。

智能化網絡運維方案(實戰夯實數字化轉型服務底座)2

圖1 端到端業務交易追蹤

2.夯實基礎,積極布局網絡智能運維平台

數據中心作為數據處理和交互的核心樞紐,保障其安全生産是各項金融業務平穩運行的基礎。經曆了腳本化→工具化→自動化的運維模式演進,如今在智能運維的道路上,北京銀行已針對網絡預測性維護和海量告警運維開展了智能化實踐。

網絡就像信息的“海洋”,表面風平浪靜,海面下可能存在很多“暗礁”,網絡中的“暗礁”就是可靠性等風險隐患。雖然這些“暗礁”當前未被觸發,但長期來看可能造成重大故障,而傳統人工巡檢方式受限于數據采集精度和人力效率,難以實時感知網絡健康劣化風險。防火勝于救火,如何系統性的排查網絡風險隐患是北京銀行正在研究的重要課題之一。目前,北京銀行已使用Telemetry技術秒級采集運維數據,解決SNMP采集精度差的問題,實時監控網絡設備運行狀況,在此基礎上通過AI算法将多個網絡指标關聯起來分析,提前識别網絡中可靠性、容量、性能、穩定性等隐患,統一評估全網潛在風險,改變以前被動救火的運維模式,降低故障發生概率。

另外,故障發生後往往引發海量告警,這些告警就像“海嘯”一樣湧向運維系統。如何有效降低告警“噪聲”也是傳統運維的一大難題,北京銀行将知識圖譜技術應用在網絡運維中,對全網基礎資源統一建模,将網絡對象、事件、傳播關系進行聯合分析,推理網絡故障根因,隻上報聚合後的根因告警,縮短故障定位時間。

智能化網絡運維方案(實戰夯實數字化轉型服務底座)3

圖2 網絡智能運維架構

3.珠聯璧合,探索應用網絡一體化運維

解決應用與網絡運維割裂、數據孤島的難點在于,網絡如何快速向應用提供數據服務,基于API硬編碼開發難以匹配敏捷靈活的業務創新模式,而網絡服務化的出現給解決這一難題帶來了希望。通過将網絡原子API進行服務化,并全面開放網絡數據服務,實現拖拽式整合即可快速發布場景化API與上層應用系統對接,大大縮短了系統間集成周期。

基于此,北京銀行探索應用和網絡一體化運維的新模式,網絡運維平台開放“網絡路況”服務并與應用性能分析平台集成,将業務交易的全服務路徑與業務流的網絡轉發路況進行一鍵關聯,基于網絡流量貫穿全局從而實時感知業務變化和質量劣化,通過應用到網絡端到端路況可視,快速定界問題邊界并定位具體故障原因,從而及時保障業務穩定運行和用戶體驗,也将運維從人工協作和數據孤島中解放出來,打破運維邊界,形成高效聯合的作戰能力。

智能化網絡運維方案(實戰夯實數字化轉型服務底座)4

圖3 應用網絡一體化運維示例

持續演進,開拓進取,夯實“數字京行”服務底座

北京銀行首創的應用網絡一體化運維模式,當前已在順義數據中心部署并在青島分行業務中實踐應用。實時呈現該業務調用鍊的路徑(客戶端→LB→系統RS…)和關鍵KPI(響應率、成功率等),實時分析各應用節點之間的通信性能(建連時延、響應時延等),深入解析業務包交易明細,如果發現LB到系統RS之間通信時延大,可一鍵下鑽到“網絡路況”界面,呈現該業務流在網絡中的真實轉發路徑,以及該路徑上面的“路況”信息(狀态、丢包、性能KPI等),數分鐘之内即可定位出業務問題原因,運維效率大大提升。

時代變遷,不變的是“以客戶為中心”的客觀規律,北京銀行以金融科技和數字技術為支撐,加快“數字京行”建設和用戶體驗的升級。展望未來,北京銀行将不斷深化科技戰略布局,着力構建起獨具自身特色的企業級基礎架構體系,支撐全行轉型增效。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved