壹般來說,運維工程師是互聯網公司的運維事業部,通常隸屬於技術部門,是支撐互聯網產品技術、研發、測試、系統管理的四大主要部門。國內公司和國外公司、大公司和小公司的劃分會有所不同。主要工作內容如下:
1.確保業務系統的長期穩定運行。
畢竟業務系統出了差錯,用戶會投訴,所以運維工程師的核心工作就是保證業務系統的穩定運行。
首先,我們必須知道業務是在什麽基礎上運行的。壹般來說,網站服務器有nginx,apache等。,並依靠mysql數據庫進行數據存儲,PHP進行分析。因此,運維工程師必須掌握LNMP、LAMP等環境部署的知識。
2.確保數據的安全性和可靠性。
數據安全是公司領導最重視的部分,運維工程師也要保證數據的安全可靠。稍有差錯,領導就和運維部門喝茶。
有時候需要手動更改數據庫的內容,所以壹定要學會掌握添加、刪除、檢查、更改mysql數據庫的知識。
有時候需要處理數據庫的服務器硬件壞了,需要Mysql主從復制以備不時之需;
有時候需要恢復數據庫,所以需要學習mysql增量備份和恢復,恢復到指定的時間點;
有時候常規備份不夠,需要使用rsync+inotify進行實時備份;
有時候為了增加服務器的安全性,需要通過iptables來控制公司的IP或者跳板IP的訪問權限;
3.建立壹個監控和報警系統
運維工程師經常使用zabbix和nagios進行告警監控。如果沒有監控運維,他們就瞎了。因此,需要先構建壹個報警監控系統,然後解決系統故障。
壹般來說,常見的故障有應用故障、數據庫故障、網線故障等。,有的是軟件故障,有的是硬件故障,有經驗的運維工程師可以第壹時間定位故障原因。
4.技術和商務問題的處理
這裏有兩個核心問題,即技術問題和業務問題。技術問題主要需要網絡抓包分析、tcpdump抓包分析和代理機制等。
商業問題比技術更復雜。比如業務層面的數據分析,不僅需要統計業務數據的各種指標,還需要對數據進行分析解剖,找出業務存在的問題。
5、版本測試和上線
這也是運維工程師的常見工作,負責版本的測試和上線。開發者發布版本前,運維工程師需要進行性能和功能測試;另外,版本上線時,最好在業務量小的晚上上線,避免上線壓力過大。
摘要
運營和開發是兩個完全不同的方向。如果做運維,有發展基礎的話,轉崗也不是不可以。
運維負責具體的產品線運維工作,還需要掌握開發能力,深入業務,最了解業務的痛點和問題。、
同時針對產品業務需求研發/優化平臺、工具和手段,有機會接觸各種優秀的系統架構,有比較優劣的能力。同時,對業務的控制決定了相應的運維工程師在業務發展中的作用。