參與公司IT系統和各應用系統架構的設計、審核和優化;
3.全面負責公司運維項目的系統升級、擴容需求和資源落實,測試和調整運維平臺以滿足發展需求;
4.負責網絡設置、網絡和服務器的維護和優化、網絡安全監控、系統性能管理和優化、網絡性能管理和優化;
5.為開發部門和業務部門建立服務流程和服務標準;
負責IT運維相關流程的規劃、設計、實施、執行和持續改進;
7 .負責內部分配並對執行結果負責。
負責日常網絡和子系統的管理和維護。
負責相關應用平臺的設計和部署,並提交平臺的實施和運行報告。
10負責配合壹個測試平臺的開發和搭建,協助開發、設計、實施和持續改進。
11負責排除相關故障和疑難問題,對故障和問題進行匯總,定期提交總結報告。
12負責網絡監控和應急響應,保證網絡系統7*24小時連續運行。
操作和維護的技術指導
服務監控技術:包括監控平臺的開發和應用,服務監控的準確性、實時性和全面性的保證。
服務故障管理:包括服務故障方案設計、方案自動執行、故障總結並反饋到產品/系統設計層面進行優化,提高產品穩定性。
服務能力管理:測量服務能力,規劃服務機房的新建、擴建和遷移。
服務性能優化:全方位,包括網絡優化、操作系統優化、應用優化、客戶端優化等。,提升服務性能和響應速度,提升用戶體驗。
全局業務流量調度:接入業務流量,根據容量和業務狀態分配各機房的流量。
服務任務調度:服務的各種已調度/未調度任務的調度觸發和狀態監控。
服務安全:包括服務訪問安全、攻擊防範、權限控制等。
數據傳輸技術:包括p2p等各種傳輸技術的研發和應用,長距離大數據傳輸等問題的解決。
服務自動發布和部署:部署平臺/工具的研發和平臺/工具的使用,安全高效地發布服務。
服務集群管理:包括服務器管理和服務的大規模集群管理。
服務成本優化:盡可能減少用於服務運營的資源,降低服務運營成本。
數據庫管理(DBA):通過設計、開發和管理高性能數據庫集群,數據庫服務更加穩定、高效且易於管理。
平臺開發:開發和管理docker-like和google borg平臺,以及服務訪問技術。
分布式存儲平臺的開發和優化:研究和開發像google gfs和服務訪問這樣的分布式存儲平臺。