隨著金融行業數字化轉型和金融科技創新應用的不斷加快,依托傳統IT架構建設的核心金融業務系統與基于云計算、大數據、區塊鏈技術構建的數字化創新業務之間,無論在底層架構、技術應用,還是管理方式上都存在著巨大的差異和數據斷層,數字化業務規模越大管理難度越高。
而身處其中的ServiceHot,客戶卻覆蓋了國有大型銀行、股份制商業銀行、大型保險集團、一線券商。
ServiceHot專家把運維分為“基礎設施建設”和“IT運行維護”兩大領域,并進一步提煉出包括“業務管理”、“人員與組織”、“流程與制度”、“技術與工具”的四大管理模型。本文結合金融行業的特性,將逐一解讀:
一、業務管理:從“運維”走向“運營”
隨著金融業務的迅速發展和規模的急劇擴大,金融IT系統的數量、規模及復雜度呈幾何級增長。業務對IT系統的安全性、可用性與持續性依賴程度越來越高。因此,“科技支撐業務”是金融行業科技部門的指導方針,穩定運行和控制風險則是IT系統運維的第一要素。但隨之帶來的問題是:IT運維部門不斷陷入到建設基礎設施、處理系統故障、應對突發業務壓力、頻繁變更上線、預防網絡入侵和信息泄露等安全風險的具體工作中,年復一年日復一日,壓力非常大。但因為缺乏“IT服務成本指標”、“面向業務的服務水平管理”等標準,運維工作的好壞在業務價值上的體現不明顯。
另一方面,在客戶互聯網化、移動化發展趨勢下,以及利率市場化的挑戰下,銀行從戰略和戰術層面積極應對,提出了金融互聯網、大數據、電子商務、客戶體驗等戰略目標,并需要為此快速推出創新業務。但這些目標所需要的海量IT能力和實時響應速度,往往不是傳統IT基礎設施解決方案所能滿足的。IT部門和業務部門的關系,已經從“科技支撐業務”變成了需要“科技引領業務”。
在此情況下,IT運維部門面臨的挑戰進一步加大,系統可用性要求越來越高,允許的維護、變更等計劃時間越來越少,為了業務創新和營銷活動還必須快速投產新項目、擴容基礎設施。
未來的運維工作要應對這樣的挑戰,首先要明確定義運維部門自身的業務是什么,從“被動響應需求和故障”向“主動提供更優質的服務”演進。為此要先做好頂層設計與規劃。根據具體的業務目標,制訂出運維部門自身的業務目標,清晰梳理出運維需要對外提供的服務,實現IT服務管理,并根據業務目標不斷迭代,實現從“被動運維”向“主動運營”的跨越式發展。圖1是根據互聯網和金融的運維經驗,總結出的運維和運營的主要業務場景,供大家參考。
二、人員和組織:從“天下名將"走向“體系保障”
運維上層的業務目標和管理思想的變化,必然會帶來人員和組織的變革。傳統運維在組織上往往采取按照職能劃分為“煙囪式”的部門,部門之間的壁壘與鴻溝很大,跨部門的溝通與協調成本過高。在人員方面,金融行業普遍聘用外部公司人員,水平參差不齊,自主運維能力不足,且應急響應速度與工作飽和度、崗位專業化與綜合化之間均存在矛盾。正如亂世出英雄,在此情況下,每個部門都會出現一些能力非常突出的技術骨干,運維工作在很大程度上依靠他們個體的能力和經驗,可謂運維的“天下名將”。
“天下名將”的運維模式,對于個人而言是非常好的鍛煉,短期之內效果不錯,但很難復制和形成標準化的培訓體系。對于組織而言則是一個巨大的風險和不確定因素,畢竟人都可能會犯錯,同時還存在人員更換和流失的風險。
未來,隨著金融業在新核心中加速引入“分布式架構”、“SOA的開發框架”等新技術,會對傳統的運維組織模式帶來挑戰。兩地三中心、分布式數據中心、devops等新的管理模式也要求組織架構做出相應變化。云計算、大數據、虛擬化、軟件定義數據中心等新技術也會對傳統運維人員的能力提出挑戰。為了迎接這些變化和挑戰,需要運維管理部門打破傳統的組織壁壘,形成一體化的運維模式,以及良好的績效考核和人員培訓長效機制,通過體系實現運維保障。當前,一些銀行實行的“一體化大運行”和“二次分配”都是比較好的嘗試。
三、流程與制度:從“txt”模式走向“exe”模式
傳統金融行業非常重視風險與合規,在流程與制度上下大功夫。從ITIL流程體系建設開始,到COBIT和六西格瑪理論,制訂出了大量的流程和制度,為業務的穩定運行起到很好的效果。但從IT運維的運行效果看,由于過分強調流程管控,流程做得非常重,導致流程的自動化和智能化程度不高,制度執行的自動化監督和檢查手段不足。由于流程制度落地的“最后一公里”還是依靠人來進行,很多情況下流于紙面的“txt”。迫切需要引入運維數據分析工具和自動化、智能化的流程工具平臺,確保流程和工具的不斷改進和自動執行,形成“exe”模式。另外,由于整個技術架構和運維思想的變化,還需要運維管理的職能部門與時俱進,重組服務流程、修訂組織制度。
四、技術與工具:從分散走向整合
金融行業從信息化的開始,就非常重視技術與工具的應用。如圖2所示的工具應用過程,第一階段是監控體系的建立,第二階段是IT服務管理體系的建立,第三階段是自動化運維工具的建立,無論是重視度還是投入度在國內各行業都處于領先地位。
回顧金融業運維工具的引入歷程和使用效果,也存在一些不足,強調工具本身的先進性和技術選型,忽視了工具背后的管理思想以及配套流程和制度的修訂,導致整體技術架構的靈活性不足,各種異構的管理工具產品缺乏有效整合,總體自動化程度不高。例如,監控系統的廣度和深度不夠;ITIL系統側重于流程建立和工單審批,核心的配置管理和變更管理未得到很好應用;運維自動化工具側重于簡單重復的操作自動化,覆蓋的場景少。
隨著虛擬化和云計算的普及,以及傳統的大型機和小型機向開放平臺遷移,未來數據中心管理的基礎設施規模和復雜度都將急劇增加,實現海量基礎設施的管理和業務的敏捷,將是運維部門必須面對的課題。在這種情況下,通過運維工具實現自動化和精細化管理,是唯一的辦法。運維部門必須拋棄原來孤立和分散采購運維工具的思路,在統一的規劃下,以建設運維管理體系為目標,整合和改進運維工具,并將人員組織、流程制度融合與固化到運維工具中,實現技術標準化、資源彈性化、管理自動化、管控集中化、運行可視化、流程智能化。
五、對于金融IT運維的總結和展望
未來IT發展的方向一定是“去IT化”,即通過科技創新,實現IT和業務的融合,完美快速地交付IT服務,使IT部門從成本中心、服務提供者的角色,轉變為企業內各部門業務發展的戰略伙伴,實現科技引領業務。對金融行業更是如此,隨著互聯網宅銀行的全面開放,未來的企業競爭一定是業務和技術融合的綜合能力競爭。
因此,新一代金融數據中心的建設和運維,重點不是關注技術概念,也不是單純思考如何利用技術重建或翻新數據中心,而是根據自身業務發展現狀和未來規劃,逐步實現在技術工具、人員組織、流程制度、業務管理四個核心要素方面的有機融合和持續改進。因此,未來的運維模式將對數據中心運營服務的管理能力產生巨大影響,也對傳統IT運營團隊提出了更高要求,需具備更新、更全面、更高層次的技術、運營、管理和服務等綜合能力。
當前,金融行業出于安全性考慮,更多會選擇私有云作為云計算的實施方向和切入點。對于金融行業的IT管理部門而言,云計算可以有效解決傳統數據中心面臨的資源管理復雜、運維操作風險高、服務響應慢等難題,節約了大量成本,增加了業務敏捷性。隨著深入應用云計算技術,未來銀行業可能形成內部私有云和外部行業公有云相結合的混合云模式,實現“實時基礎設施”。
ServiceHot 專家認為“三分基礎設施建設,七分運維體系建設”,對于金融行業來說,關鍵是能與時俱進地變革自身,構建高效的管理體系。運維變革最終完成的標志是面向業務的動態變更。最終的成敗和效果不僅取決于技術因素和數據中心建設因素,而是由整個企業的IT戰略決定。需要從戰略、規劃、架構、開發、運維多個領域進行統籌規劃,提升部門間的溝通和協作水平,促進應用架構與基礎設施架構融合,設計出更合理的應用架構,提升應用研發速度和用戶體驗,讓業務人員和最終用戶感知到效果。 對所有金融行業的IT運維從業者而言,未來是“危”與“機”共存的時代。既要支撐當前的業務平穩運行,又要大力推進面向未來的轉型,每一個行業從業者,必然會面臨很大的壓力和危機意識。另一方面,這也給大家創造了彎道超車、打造先進云數據中心的跨越式發展機遇。推動運維行業變革,從傳統的“運維”走向“運營”,從“成本部門”變成“效益部門”,是所有運維從業者的希望。相信在不久的將來,通過行業同仁的共同努力,“讓天下沒有難運維的數據中心”這一美好愿望定能實現。