原文:《剖析IT運維管理當前面臨的問題》

隨著中國信息化水平發展的加速,IT系統越來越復雜,越來越龐大,公司業務對IT系統的依賴性也日漸提高,IT系統的任何波動和故障,都會直接影響公司業務的正常開展和進行,企業需要具備合理有效的IT運維策略來保證業務系統的正常運作。


一、IT運維管理的現狀及問題


信息系統的架構創新不僅僅帶來了效率提升、成本下降等管理層面的價值,更是成為了企業加速形成差異化經營、保持核心競爭力優勢的關鍵,而IT系統的運維與管理是企業業務系統的保障,更是企業生存和快速發展的支撐。


公司在信息化水平日益完善的同時,隨之而來的是更多的應用系統、軟硬件平臺和設備等需要維護和管理。如何對結構復雜的IT系統進行有效的監控和管理,已經成為了企業信息化部門非常關注的一個問題。作為IT管理部門,經常被大量的IT故障和問題所困擾,“拆東墻補西墻”的尷尬場景也是常常上演。不論哪一家企業,只要它的員工和IT系統發展到一定的水平,就會不可避免地面臨IT系統管理的一系列難題。


IT運維管理工作中可能存在的問題有:


1.1.IT運維管理機制不完善,流程操作不統一


許多企業尚沒有建立起穩定和規范的IT運維機制。現有的IT運維流程的操作不規范不統一。如IT事件單提交之后,事件預判和優先級的設定不統一,沒有規范性的指導文檔,僅以運維工程師的經驗判斷或約定俗成的主觀方式引導IT事件的處理。有識別但不規范,有處理但無管理,有人員但疲于應付,有系統但用不好。因此,“輕規范、重維護”的IT運維管理現狀很容易造成因員工技能水平參差不齊帶來的IT運維不穩定,直接影響維護體系的效果。簡單點說就是還未脫離傳統管理思想的束縛。


1.2.過度依賴核心人員,年輕員工成長慢


IT運維管理是一個系統性的技能,在實際工作中積累的的經驗始終僅能在小范圍內得到傳播和繼承,這就形成了企業里面的一個特殊景象,同樣是IT運維部門,有的員工獨擋一面從白天忙到天黑累倒吐血,有的員工經驗平平幫不上什么忙反倒悠哉游哉。尤其是IT的使用部門,對于有經驗的IT運維人員更加依賴和倚重,這樣導致了無論是IT事件性質的識別、優先級的界定,還是問題的分析判斷,均匯總至少數核心人員進行處理。所謂大事小事一把抓,這樣不僅增加了少數核心人員的工作量,也容易產生工作流程的“瓶頸”,降低運維管理部門整體的工作效率,也會讓一些核心員工產生巨大的壓力感。


1.3.IT運維管理的KPI考核機制尚不完善

現在有很多企業的IT運維部門的績效考核難執行,績效考核的標準也很難制定,匆匆上馬的績效考核也難見效。目前在績效考核方面雖然采用填寫表單的方式對不同崗位的工作時間進行收集、評測和考核,雖然確實體現了IT運維人員的工作量和工作負荷,但還是不能全面準確的反映IT運維人員真實的工作績效。因此,IT運維人員績效考核機制是要進一步完善的。不但需要參考同行和同業的好的做法,更要由考核部門和管理部門一起深入配合和實踐。

1.4.缺乏IT基礎管理工具和系統

基于OA系統,再加上財務、CRM、業務系統等構成了公司的核心運營系統。這些復雜的核心系統是企業整體業務順暢運營的關鍵。但作為支撐核心系統運行的IT基礎架構和運維系統,很多企業并沒有配備。現有的IT管理工具偏重于技術層面的故障發現及預警,對于發現的事件雖有相應的管理流程匯報,但仍未找到合適的工具為其提供全面、安全、穩定的運行支持。在ITSM這一塊,有相當大的缺失。

1.5.缺乏有效和完善的配置項管理數據庫(CMDB)

目前企業的IT運行維護僅有對核心應用系統相關IT設備的簡單梳理,雖然收集了部分配置項信息,但是當前僅限關鍵業務的、缺乏工具支持的、簡單的CMDB建設,已經很難滿足未來企業IT信息化的高標準。CMDB的建設不是一蹴而就的,不僅需要詳細的配置項屬性數據和準確的相關信息,而且還需要一個科學有效的配置管理模式及工具系統予以支持。

1.6.缺少面向IT使用部門和個人的運維服務報告

IT運維管理對核心系統的運行提供固定的IT服務報告,如:系統運行報告、工單處理報告、滿意度報告、SLA報告、周/月/季度/年度報告等等。但由于IT管理報告的內容多以技術語言提交且僅限部門內部和少數領導參閱,IT事件的提交者暨IT使用者卻無法得到相關的事件處理報告。作為外部用戶的業務部門不僅無法接觸,而且受專業所限難以理解,無法充分利用IT管理報告提供的信息。在IT運維部門從成本中心向利潤中心轉型的過程中,IT運維面向外部IT使用者時不能再以晦澀難懂的技術語言提交IT管理報告,而應采用符合一般用戶閱讀需要的IT服務報告,實現IT運維的“服務于用戶,為用戶所用”的目的。


二、IT運維的建設思路

IT運維管理應當時刻保證企業信息化網絡的正常運轉,同時保障信息的完整性、可用性和保密性,實現高效運維管理。

制定高效運維機制的主要思路有:

2.1.合理的用人策略

一個高效的IT運維部門應當進行合理的職責定位,實行網格化崗位分工,有效的避免單點故障出現時可能出現的風險,實現人力資源的互為備份。采用科學的人才激勵機制和KPI考核機制,堅持“以人為本”,做到“以待遇留人、以感情留人、以事業留人”,提高運維工程師的待遇,補充新進技術人才。同時進行管理模式的優化,可按照地域范圍,組建分片的運行維護中心,增強運行維護體系的專業性.

2.2.規范的運維制度

應當健全部門管理制度,使日常的運維工作流程化,職責角色清晰,并加強對危險的防范意識,對安全建設具有完整的規劃和加固方案對于各種安全防護產品能夠綜合應用,從而能夠使整個系統保持在相對穩定安全的狀態。IT運維工具和系統應當能夠提供可視化的運維儀表盤,對全局進行監測,并可根據累積的數據進行分析和趨勢預判。

2.3.高效的流程管控

完善IT運維服務平臺的建設,開通運行運維支持系統和知識庫平臺。同時IT運維人員也應當增強服務意識,將服務理念引人IT運維管理的建設,對每一個工單的處理,都實行負責機制。優化IT運維流程,引入扁平化管理模式制定有針對性的培訓計劃,既要兼顧IT技術和IT架構的發展,又要考慮到實際的需求。同時對企業員工的IT技術和IT知識加強培訓,提高整體的運行水平;以需求為動力,建立積極的運維服務理念;改變誰負責誰培訓的方式,突破技術局域性限制,提高IT運維的效率。

三、總結

加強IT運維管理理念,制定合理的運維策略和流程,可以從根本上提高IT運維效率,一方面可以提高企業的安全管理能力,杜絕信息泄露、網絡攻擊等信息安全問題,保障企業的安全運轉,另一方面,作為企業業務能力的一部分,規范化和穩定的運維管理可以有力的支撐企業的日常經營,提高企業的核心競爭能力。可以這樣說,好的企業一定會有一個好的IT運維部門,有志于提高競爭力的企業一定要在企業的發展階段就制定出適合自己的IT運維策略。