2018 年已經接近尾聲,回顧這一年,國内企業都在進行數字化轉型,大家越來越關注如何提升效率。在這一過程中,颠覆性的 IT 技術正在加速落地:容器技術、Kubernetes 的使用已經越來越普及,雲計算和大數據結合更緊密,AIOps 的實踐也在不斷成熟改善,雲原生和 DevOps 的理念文化也在慢慢滲透到大小規模的技術團隊,對運維人員帶來很大的沖擊,傳統運維團隊紛紛在轉型,自動化甚至智能化運維已經成為了趨勢。在這樣的背景下,企業運維團隊如何向 DevOps 轉型,如何使用更好的文化和方法來提升效率?我們采訪了騰訊 IEG 藍鲸團隊的黨受輝,談一談像騰訊這樣的大廠的運維如何轉型。
講師介紹黨受輝,騰訊互動娛樂技術運營部 藍鲸産品中心總監。
騰訊 T4 工程師,曾就職于東軟集團,為能源行業定制企業信息化體系,加入騰訊後負責運維團隊管理。2012 年負責互動娛樂事業群基礎 PaaS(藍鲸)的設計、建設和運營。結合微服務、雲、大數據等理念及前沿技術,構建獨立部署的 PaaS 體系,并通過 SaaS 化産品,助力行業内應用運維團隊的轉型升級,推動 devops 生态及智能化運營。
1. 騰訊這樣的大公司,在運維體系的構建過程中如何避免“重複造輪子”?在升級演進的過程中如何避免浪費?
黨受輝:在騰訊的互動娛樂事業群(IEG),我們采用 PaaS 技術來架構運維體系,其中的 iPaaS 層可以兼容已有的重複性功能模塊,并且在升級過程中可以采用長期雙軌運行的方式平滑替換升級,相比于傳統的“煙囪群”式系統的“推倒升級”,避免大量的風險及浪費。
2. 在 DevOps 等理念和技術的沖擊下,傳統運維團隊如何轉型應對?
黨受輝:從技術角度看,一個業務的全生命周期可以分為 CI-CD-CO 三段,CI 指的是持續集成,從研發團隊提交代碼作為起點,經過便以構建掃描測試等環節,以版本倉庫為終點;CD 指的是持續部署,以版本倉庫為起點,經過各模塊自動化部署,到業務上線提供服務為終點;CO 指的是持續運營,從業務上線服務為起點,到業務下線終止服務為終點,期間包含各種運營事件。
傳統運維的定位主要在 CD 段,但由于微服務、虛拟化、容器化等技術的沖擊之下,運維對 CD 段的把控在減弱,甚至有些公司直接按照 SRE 等理念從開發側覆蓋了運維團隊的部分職能,從而使運維團隊萎縮到了管理資産和成本的角色,喪失了精細化運營能力。
騰訊 IEG 的運維團隊借助 PaaS 技術,将運維團隊轉型為“運維開發”團隊,首先完成了自身 CD 段的自動化工具構建,而後通過 iPaaS 集成大數據能力,服務于 CO 段的業務及非技術人員,最後仿照運營 aPaaS 的持續集成流水線,為業務開發團隊打造了 CI 段的全套工具産品,完成了對業務及業務團隊全生命周期的運營支持。
3. 關于 CI-CD-CO 具體指的是什麼意思?
黨受輝:CI 指的是持續集成,從研發團隊提交代碼作為起點,經過便以構建掃描測試等環節,以版本倉庫為終點;CD 指的是持續部署,以版本倉庫為起點,經過各模塊自動化部署,到業務上線提供服務為終點;CO 指的是持續運營,從業務上線服務為起點,到業務下線終止服務為終點,期間包含各種運營事件。
4. 騰訊是如何看待“運維開發”這一全新崗位的?與 AIOps 有什麼關系?
黨受輝:我們将運維開發視為與測試開發、營銷開發等并列的一種崗位,主要職能是做工具類的運營系統,例如持續集成、日志分析、資源管理、版本發布、環境變更、監控處理、災備切換、日常巡檢、電子工單、運營分析、運營管控、經營管理等。互聯網公司面臨着很大的競争壓力,需要從各個層面提升經營效率,降低成本。而落地工具文化,是途徑之一。我們依托 PaaS 技術,将傳統應用運維團隊轉型為運維開發團隊,來承擔這一重要職能。運維開發團隊以 Python 為主語言構建 PaaS 之上的 SaaS 應用,而在從運維開發向 AIOps 的體系化過渡過程中,也可以以較低的成本完成轉型。
5. 如何體系化的落地智能運維(AIOps)?
黨受輝:如果要“體系化”的落地智能運維,需要首先構建完善的機械自動化體系以及完整的數據分析體系,最後輔以符合運維技術棧的分析挖掘平台來實現。否則隻能是作為案例或試點存在,無法“體系化”推進。
6. 騰訊如何使用 Kubernetes 構建容器管理體系,在“特殊化定制”與“保持與社區版本同步升級”之間如何平衡?
黨受輝:社區版本升級和個性化功能定制的确是很多企業的矛盾,我們在容器管理平台中采用 k8s 與 mesos 雙引擎并行的方式來解決這個問題。
7. 騰訊這樣體量的公司,其海量運維體系的邏輯、方法和經驗,是否适用于中小企業或初創公司?
黨受輝:騰訊 IEG 雖然有一萬多名員工,五百多款業務,但由于不同業務間的體量差異很大,有幾萬節點的大型遊戲,也有數百節點的中小型遊戲,因此其理論方法和實踐經驗适合于不同規模和類型的企業。
8. 本次 CNUTCon 全球運維技術大會—深度培訓專場,騰訊 IEG 藍鲸團隊帶來的 5 大主題分享,适合什麼樣的群體,可以為我們帶來什麼收獲?
黨受輝:适合于a 希望在企業中落地自動化、數據化、智能化的運維團隊;b 希望從傳統運維轉型為運維開發的團隊;c 希望從資源資産管理轉向業務管理的運維團隊;d 希望從傳統 SLA 保障轉型為對業務提供“技術運營”支持的運維團隊。發
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!