階段1: JavaSE基本核心
1,深刻理解Java面向對象思想
2.掌握開發中常用的基本API。
3.熟練使用集合框架、IO流和異常。
4,可以基於JDK8開發。
第2階段:Hadoop生態系統架構
1,Linux系統的安裝與操作
2、掌握Shell腳本語法。
3.Idea和Maven等開發工具的使用。
4.Hadoop的組成,安裝,架構和源代碼的深度分析,API的熟練使用。
5.Hive安裝部署,內部架構,熟練運用其開發需求和企業級優化。
6.Zookeeper的內在原理,選舉機制,大數據生態下的應對。
階段3: Spark生態系統架構
1,Spark的初始安裝和部署,熟練使用Spark核心的基本API,高級RDD編程,掌握累加器和廣播變量,掌握Spark SQL編程以及如何自定義函數,Spark內核源代碼詳解(包括部署、啟動、任務劃分和調度、內存管理等),以及Spark的企業級調優策略。
2.安裝和部署DophineScheduler,熟練使用工作流的調度和執行。
3.了解數據倉庫的建模理論,全面熟悉電子商務行業的數據分析指標體系,快速掌握多種大數據技術框架,了解多種數據倉庫技術模塊。
4.HBase和Phoenix的部署和使用,原理架構和企業級優化的講解。
5、開發工具git &;Git Hub的巧妙使用
6.Redis介紹,基本配置說明,jedis掌握。
7.ElasticSearch的引入、安裝、部署和優化
8.充分了解用戶畫像管理平臺的建設和使用,用戶畫像系統的設計思路,以及標簽的設計流程和應用,初步了解機器學習算法。
9.自主搭建功能齊全的企業級線下數據倉庫項目,提高實際開發能力,加強對線下數據倉庫各功能模塊的理解和認知,實現各類企業的實際需求,積累項目性能調優經驗。
階段4: Flink生態系統架構
1,掌握Flink的基本架構和流數據處理的思想,使用Flink的眾多Soure和Sink處理數據,使用基本API、Window API、state函數、Flink SQL和Flink CEP處理復雜事件。
2.使用Flink搭建實時倉庫盤點項目,熟練使用Flink框架分析計算各項指標。
3、ClickHouse安裝、使用和優化
4.項目實戰。貼近大數據的實際處理場景,多維度設計實戰項目,可以幫助我們更廣泛地掌握大數據需求的解決方案,參與項目建設的全過程,在短時間內提高學生的實戰水平,加強對各種常用框架的理解,快速積累實戰經驗。
5、可選碩士推薦和機器學習項目,熟悉並使用系統過濾算法和基於內容的推薦算法等。
6.用阿裏雲平臺的全套大數據產品重構電商項目,熟悉線下倉庫盤點、實時指標的阿裏雲解決方案。
第五階段:就業指導
1,從技術和項目角度根據企業訪談、
2、熟悉CDH在生產環境中的使用。
3.簡歷指導
以上是大數據培訓需要掌握的內容,當然妳也可以嘗試自學。