大數據解讀:處理信息的六個關鍵環節
大數據按照信息處理環節可以分為數據采集、數據清理、數據存儲及管理、數據分析、數據顯化,以及產業應用等六個環節。而在各個環節中,已經有不同的公司開始在這裏占位。
1、數據采集:Google、CISCO 這些傳統的IT公司早已經開始部署數據收集的工作。在中國,淘寶、騰訊、百度等公司已經收集並存儲大量的用戶習慣及用戶消費行為數據。德勤預計,在未來,會有更為專業的數據收集公司針對各行業的特定需求,專門設計行業數據收集系統。
2、數據清理:當大量龐雜無序的數據收集之後,如何將有用的數據篩選出來,完成數據的清理工作並傳遞到下壹環節,這是隨著大數據產業分工的不斷細化而需求越來越高的環節。除了Intel等老牌IT企業,Teradata、Informatica等專業的數據處理公司呈現了更大的活力。在中國,華傲數據等類似廠商也開始不斷湧現。德勤預計,在未來,將會有大量的公司專註於數據清理。
3、數據存儲及管理:數據的存儲、管理是數據處理的兩個細分環節。這兩個細分環節之間的關系極為緊密。數據管理的方式決定了數據的存儲格式,而數據如何存儲又限制了數據分析的深度和廣度。由於相關性極高,通常由壹個廠商統籌設計這兩個細分環節將為更為有效。從廠商占位角度來分析,IBM、Oracle等老牌的數據存儲提供商有明顯的既有優勢,他們在原有的存儲業務之上進行相應的深度拓展,輕松占據了較大的市場份額。而 Apache Software Foundation等新生公司,以開源的戰略匯集了行業專精的智慧,成為大數據發展的領軍企業。
4、數據分析:傳統的數據處理公司SAS及SPSS在數據分析方面有明顯的優勢。然而,基於開源軟件基礎構架Hadoop的數據分析公司最近幾年呈現爆發性增長。例如,成立於 2008 年的Cloudera公司,幫助企業管理和分析基於開源Hadoop產品的數據。由於能夠幫助客戶完成定制化的數據分析需求,Cloudera擁有了如Expedia、摩根大通等大批的知名企業用戶,僅僅五年時間,其市值估值已達到7億美元。
5、數據的解讀:將大數據的分析結果還原為具體的行業問題。SAP、SAS等數據分析公司在其已有的業務之上加入行業知識成為此環節競爭的佼佼者。同時,因大數據的發展而應運而生的wibidata等專業的數據還原公司也開始蓬勃發展。
6、數據的顯化:這壹環節中,大數據真正開始幫助管理實踐。通過對數據的分析和具象化,將大數據能夠推導出的結論量化計算、同時應用到行業中去。這壹環節需要行業專精人員,通過大數據給出的推論,結合行業的具體實踐制定出真正能夠改變行業現狀的計劃。
以上是小編為大家分享的關於大數據解讀 處理信息的六個關鍵環節的相關內容,更多信息可以關註環球青藤分享更多幹貨