原文:《IT運維,關注技術還是管理》

近年來,國內外各企事業單位都十分重視信息化建設,把加快信息化建設作為提高生產經營管理水平、促進業務流程優化、加強內部控制、提高決策質量和效率的重要手段。

隨著企業信息化的進一步深入發展,企業關注的不再是應該用何種網絡管理產品,而是什么樣的IT運維產品能夠真正提高IT運維的效率、實現其價值,從而來實現企業IT效益的最大化,而企業既有的運維方式不能滿足其高速發展的業務系統運轉之時,改革運維方式成為必然。


技術型IT運維所面臨的困境


傳統的IT運維管理是救火式的管理。通常是用戶先于IT人員發現問題,然后再找到IT部門要求解決問題。這是由于傳統的IT管理采用人工方式管理基礎設施,網絡管理是從各種IT基礎設備出發的,僅僅是保障各類IT設備如服務器、數據庫、存儲設備、交換機等等基礎設施的正常運行。

不采用任何管理軟件,僅僅靠運維人員定期輪詢,或者執行某項命令來檢查設備,在系統規模較小時,只要參與運維的技術人員足夠負責,人工運維方式是可以滿足日常運維需要的。但是,當應用系統達到一定的規模后,這種運維方式的弊端就暴露出來了。輪詢一遍要花費幾個小時,這樣,輪詢周期越長也就代表越需要更久才能發現故障。這種被動式管理IT導致有了問題不能及時發現,給企業業務的正常運行帶來了極大的影響,甚至造成較大的經濟利益損失。

市場研究機構Gartner調查發現,在導致IT基礎設施出現故障的原因中,源自技術或產品方面的因素其實只占了20%,而因為運維管理方面的原因則占到80%,可見IT系統運維管理思想是相當重要的。所以,我們必須要向管理要效益。


高效IT運維需要轉變運維管理思想


隨著越來越多企業對IT部門運營管理不滿意,日常維護、故障定位、事故處理方式方法等方面出現的一系列問題,都在困擾著IT管理人員。如何提高企業IT管理已逐漸成為IT部門新的熱點話題,為企業提供持續高效支撐,對IT部門而言也變得越來越緊迫。所以,我們必須要轉變運維管理思想,通過以下幾方面來實現高效的IT運維:

1)建立自動化運維管理平臺

第一步:建立IT運維的自動化監控和管理平臺。通過監控工具實現對用戶操作規范的約束和對IT資源進行實時監控,包括服務器、數據庫、中間件、存儲備份、網絡、安全、機房、業務應用和客戶端等內容,通過自動監控管理平臺實現故障或問題綜合處理和集中管理。

第二步:自動化的故障定位,通過業務服務管理,實現IT與業務的關聯,通過IP-MAC綁定信息等等,自動定位故障點。 

2)建立故障事件自動觸發流程,提高故障處理效率

所有IT設備在遇到問題時要會自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維屏幕上。然后IT運維人員只需要按照相關知識庫的數據,一步一步操作就可以。因此,企業需要事先建立自動工單式流程管理,當設備或軟件發生異常或超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關IT運維人員。IT運維人員必須在指定時間內完成流程所規定的環節與工作,以提高IT運維響應問題的效率。 

3)建立規范的事件跟蹤流程,強化運維執行力度

首先需要建立故障和事件處理跟蹤流程,利用表格工具等記錄故障及其處理情況,以建立運維日志,并定期回顧從中辨識和發現問題的線索和根源。事實上許多實踐也證明,建立每種事件的規范化處理和跟蹤指南,可以減少IT運維操作的隨意性和強化運維的執行力度,在很大程度上可降低故障發生的概率。同時,用戶還應可以通過自助服務臺、電話服務臺等隨時追蹤該故障請求的處理狀態。

4)設立IT運維關鍵流程,引入優先處理原則

設立IT運維關鍵流程,引入優先處理原則是指定義出IT運維的每個關鍵流程,不僅僅是定義流程是什么,還包括要指出每個關鍵流程對企業有什么影響和意義。同時,在設置自動化流程時還需要引入優先處理原則,例行的事按常規處理,特別事件要按優先級次序處理,也就是把事件細分為例行事件和例外關鍵事件。