二:基礎建設:安全,質量,效率,成本 是運維人員可以展開運維工作的四大方面。圍繞著這四個方面,我們需要制定規範,流程,建設對應的系統保證效率,標準化提升效率等等
質量: 立體化監控系統;測速,備份容災等等
效率: 提升運維效率的系統建設,標準化機器初始化,軟件安裝標準化,監控標準化等等,提升效率,批量部署腳本等等
安全:互聯網安全,系統支持,cgi掃描等等
成本:預算制定等等,合理優化部署,平衡成本與體驗
三:基礎建設升華:壹切以用戶價值為依歸
1:異地部署 ,異地容災
2:柔性可用 ,柔性可損
3:全網調度 ,實現成本與 用戶體驗的平衡
4:優化用戶體驗:提升速度
四:從壹個項目上看運維人員的工作分解
1:項目初期介入,提對應運維需求,需要運維工程師預計運營時可能需要的數據,可以從兩個方向考慮:A監控;B評估系統好壞的運維指標,如接口調用數據,用戶訪問速度等等,提出對應需求,開發在設計時實現,方便上線後運維采集這些數據做系統評估。 這個階段要了解系統架構,評估運維上是否合理。是否方便部署,運維風險有哪些,從哪些層面可以避免,做好容災,cache數據丟數,db down掉等的評估以及應對方案設計,全網調度方案等。
2:項目開發階段,這個階段運維也要參與其中,了解對應運維需求開發的完成情況
3:項目測試發布: 運維負責運營環境的搭建,發布上線,並監控線上系統穩定
4:項目發布後:保證對應監控,備份,容災等對應工作完成
5:項目運營階段:及時對告警進行處理,對系統發展趨勢做好評估,擴容等,預估可能的運營風向,並做好對應的應對措施
6:相關演習
7:做好系統優化,提升用戶體驗
五:從運維人員面對的周邊角色做 運維人員的工作分解
1:上遊戰略依從:理解公司發展方向,調整運營戰略
2;開發
3:測試
4:QA
5:老板等