運維,更偏向於業務產品的支持,偏向於背後的英雄,運維團隊需要為業務的穩定性,成本等方面負責!
企業需要的IT運維體系,本質上也是需要從穩定性、成本的角度來建立。
(1) 穩定性方面
穩定性,是反應服務訪問質量差甚至無法訪問的指標。業界流行的的穩定性公式是,服務總在線時間/服務總時間,具體指標數據以幾個9表示,比如壹般的雲計算服務提供上,承諾的穩定性指標是3個9:99.9%(意味著每年宕機時間不超過8.75小時),而對於大型互聯網公司的業務,對於運維的指標則是99.99%(全年宕機時間不超過52分鐘),甚至99.999%(全年宕機時間不超過8分鐘)。
穩定性方面,需要什麽樣的技術體系支撐呢?
監控體系。現在開源軟件已經讓企業的運維能力大幅提升,如zabbix,nagios等,已經被很多企業廣泛使用。同時,隨著人工智能的興起,監控的智能化精細化水平,也在不斷提升,比如,傳統的監控無非是發現異常了之後報警,但加入智能化之後,則可以自動分析異常的根本原因在哪裏,基於此則可以繼續做自動的恢復,避免人工成本。
基礎技術體系。包括硬件(服務器,網絡等),操作系統/內核等,也直接影響到業務的穩定性。現在雲計算的技術已經非常成熟,服務器與網絡方面可以由類似openstack,cloudstack等IaaS平臺管理,操作系統/OS等則可以通過docker,以及各類PaaS平臺進行維護與管理,實現穩定性的保障。
安全體系。隨著現在互聯網的飛速發展,伴隨而來的網絡攻擊也越來越瘋狂,根據普華永道的調查,針對中國公司的網絡攻擊頻率兩年內已經提升了兩倍,這也使得安全成為互聯網架構中必不可少的環節,waf應用防火墻,數據清洗,防cc,ddos攻擊等安全體系,也是必備的技術體系之壹。
(2) 成本方面
計算成本。即托管企業運行軟件所需要的服務器成本。現在雲計算廠商提供的IaaS產品也是已經非常成熟,而且價格也在不斷地下調,2016年10月,阿裏雲宣布了大量雲產品的降價,壹年內就下降十幾次,也使得企業的成本控制方便可以越來有利。
人力成本。包括運維人力,研發人力,運維人力的主要投入來自於業務穩定性的保證,比如,服務異常之後的故障恢復,容災與服務重建等。業務研發中,業務本身的叠代效率與質量,也間接影響了研發的成本。這方面則可以通過PaaS平臺的技術手段來解決。
(3) 商業化
商業化是企業運維體系的更上壹層。企業IT運維是每個企業必不可缺的環節之壹,因此,運維相關的產品也逐漸受到企業的重視。比如應用性能分析廠商(new relic),則是提供了優化服務運維質量的有效方案,監控等產品也是運維最受歡迎的產品之壹。
?