首先,區別:
作為壹個集中式存儲庫,data lake可以存儲任何規模的所有結構化和非結構化數據。在數據湖中,您可以存儲數據並運行不同類型的分析,而無需對其進行結構化。
數據倉庫(Data warehouse)又稱企業數據倉庫,是壹種數據存儲系統,它聚合了來自不同來源的結構化數據,用於商業智能領域的比較和分析。數據倉庫是壹個包含各種數據的存儲庫,高度模型化。
數據中心是承擔技術、引領業務的智能數據處理平臺,構建標準化、全球可連接、可提取的平臺。建設目標是高效滿足前臺數據分析和應用的需求。數據中心離業務更近,能更快滿足業務和應用開發的需求,可追溯,更準確。
二、關系:
數據湖和數據倉庫更多的是針對不同對象的不同形式的數據資產。在數據中心,更強調服務前臺,實現邏輯、標簽、算法、模型的復用。
數據中心就像壹個“數據工廠”,涵蓋了數據湖、數據倉庫等存儲組件。隨著數據中心的發展,未來很可能會弱化數據湖和數據倉庫的概念。
三、總結:
數據空間持續增長。為了充分發揮數據的價值,未來的數據技術趨向於融合和創新。