* *數據源:* *是數據倉庫系統的數據源,通常包括企業的各種信息,包括存儲在RDBMS中的各種業務處理數據和各種文檔數據;各種法律法規、市場信息、競爭對手信息等。
對ETL工具(informatica、ssis、owb、datastage)以及該工具的特點進行了簡要描述。
DataStage是壹個集成工具,它簡化並自動化了各種操作數據源的數據提取、轉換和維護過程,並將它們輸入到數據集市或數據倉庫的目標數據庫中。
它有四個組件:管理員:用於管理項目和環境變量。經理:用於引出職務表定義。設計師:用於設計工作。直接:檢查裝運的任務運行日誌。
數據存儲和管理:數據存儲和管理是整個數據倉庫的核心和關鍵。數據倉庫的組織和管理模式決定了它不同於傳統數據庫,也決定了它對外數據的表達形式。從分析數據倉庫的技術特點入手,決定使用什麽產品和技術來構建數據倉庫,然後對現有業務系統的數據進行提取、清理和有效整合,並按照主題進行組織。根據數據的覆蓋範圍,數據倉庫可以分為企業級數據倉庫和部門級數據倉庫(通常稱為數據集市)。
OLAP服務器:
有效整合所需數據,並按照多維模型進行組織,從而進行多角度、多層次的分析,發現趨勢。其具體實現可分為ROLAP(關系聯機分析處理)、MOLAP(多維聯機分析處理)和HOLAP(混合聯機分析處理)。ROLAP基礎數據和聚合數據存儲在RDBMS中;MOLAP基礎數據和聚合數據存儲在多維數據庫中;HOLAP基礎數據存儲在RDBMS中,聚集數據存儲在多維數據庫中。
前端工具:主要包括基於數據倉庫或數據集市的各種查詢工具、數據分析工具、數據挖掘工具、各種報表工具以及各種應用開發工具。
數據分析工具主要針對OLAP服務器。報表工具和數據挖掘工具主要是針對數據倉庫的。