當前位置:法律諮詢服務網 - 法律諮詢 - 數據治理的十個步驟

數據治理的十個步驟

以下文章來自《談數據》,作者石秀峰。

1,發現癥狀,明確目標

任何企業都不是為了管理數據而管理數據,而是被管理和業務目標所驅動。企業常見的數據質量問題包括:數據不壹致、數據重復、數據不準確、數據不完整、數據關系混亂、數據不及時等等。

這些數據問題的存在給業務的開展和業務部門之間的溝通帶來了很大的麻煩,造成了很大的成本;異構系統中的數據不壹致,導致業務系統之間的應用集成失敗;數據質量差無法支持數據分析,分析結果與實際相差較大。但要實現數據驅動管理、數據驅動業務的目標,沒有高質量的數據支撐是行不通的。

目標:企業實施數據治理的第壹步是明確數據治理的目標和關鍵點。

技術工具:實地調研、高層訪談、組織結構圖。

輸入:企業數據戰略規劃、亟待解決的業務問題、業務發展需求、業務需求等。

產出:初步溝通方案、項目任務書、數據治理工作進度表;

2、數據管理現狀分析

根據企業數據治理的內外部環境,從組織、人員、流程、數據四個方面分析了數據治理的現狀。

企業數據治理的難點分析

機構:是否有專業的數據治理機構,崗位職責和分工是否明確。

人員:數據人才的資源配置,包括數據標準化人員、數據建模人員、數據分析師、數據開發人員等。,以及數據人才的比例。

流程:數據管理現狀,是否有歸口管理部門,是否有數據管理流程,流程各環節的數據控制等。

數據:整理數據質量問題清單,如數據不壹致、數據不完整、數據不準確、數據不真實、數據不及時、數據關系混亂、數據隱私安全問題等。

目的:分析企業數據管理和數據質量現狀,確定初步的數據治理成熟度評估方案。

技術工具:實地訪談、調查表格、數據質量評估表格、關鍵數據識別方法論(如主數據特征識別法);

輸入:需求和現狀調查表、訪談記錄、數據樣本、數據架構、數據管理系統和流程文檔;

輸出:數據問題清單、數據U/C矩陣、數據治理狀況分析報告、數據治理評估方案;

3.數據治理成熟度評估

數據治理的成熟度反映了壹個組織對數據治理的條件和水平,包括元數據管理、數據質量管理、業務流程集成、主數據管理和信息生命周期管理。

CMMI DMM數據管理能力成熟度評估模型

數據治理成熟度評估是利用標準的成熟度評估工具,結合行業最佳實踐,對企業數據治理現狀進行客觀的評估和打分,從而發現企業數據治理的不足,制定可行的行動計劃。數據治理成熟後,形成初步的行動計劃,壹般包括數據治理策略、數據治理指標、數據治理規則、數據治理職責。數據治理的願景和使命是數據治理的總體目標;數據治理指標定義了數據治理目標的度量方法;數據治理規則和定義包括數據相關的政策、標準、合規性要求、業務規則和數據定義;權利和責任規定了誰負責制定與數據相關的決策,何時以及如何實施這些決策,以及組織和個人在數據治理戰略中應該做些什麽。

目的:結合行業標準的數據治理成熟度模型,根據企業管理和業務需求評估數據治理的成熟度,形成初步的數據治理策略和行動路線。

技術工具:數據治理評估模型,如DCMM、CMMI DMM、IBM數據治理成熟度評估模型等。

輸入:步驟2的輸入,數據治理評估模型和數據治理評估工具(評估指標、評分表等。);

輸出:數據治理評估結果、數據治理策略和初步行動計劃;

4.數據質量問題的根本原因分析

數據治理的目的是解決數據質量問題,提高數據質量,從而為數據驅動的數字化企業提供源動力。說到數據質量問題,做過BI和數據倉庫的同學壹定知道,這是壹個技術和業務“經常打架”的問題。

企業魚骨圖中數據問題的根本原因分析

數據質量問題的原因很多,有業務的,有管理的,有技術的。根據80/20法則,80%的問題是由20%引起的。所以,如果能解決這20%的問題,就能得到80%的改善。

目的:分析並找到數據質量問題的根本原因,制定有效的解決方案;

技術工具:頭腦風暴、5W1H、SWOT、因果(魚骨)圖、帕累托圖等。

輸入:數據問題列表、數據U/C矩陣、數據治理狀況分析報告、數據治理評估結果;

輸出:數據質量評估結果、對業務的潛在影響和根本原因。

5.業務影響和實施優先級評估

通過數據治理的成熟度評估,從組織、流程、系統、人員、技術等方面找到企業在數據治理中需要改進的領域和環節,進而通過數據質量根本原因分析找到數據質量問題的根源,進壹步明確數據治理的目標和內容。然後,我們需要確定數據治理策略,並定義數據治理的實現優先級。

企業中主數據治理的優先級評估

不同領域的數據治理解決不同的問題,每個領域的數據治理都有其實現的困難。對於企業來說,需要從業務影響、問題緊急程度、實施難度等多個維度進行分析權衡。,從而找到符合企業需求,符合企業發展的解決方案。

目標:確定數據治理核心領域和支持系統的建設/實施重點;

技術工具:四象限法(從業務影響/實施難度、問題重要性/問題緊急程度繪制優先級矩陣)和KANO模型。

輸入:數據治理成熟度能力評估結果和數據質量問題根本原因分析結果;

輸出:數據治理實施優先級策略

6.制定數據治理的行動路線和計劃。

路線圖是通過使用特定的技術解決方案來幫助實現短期或長期目標的計劃,用於新產品、項目或技術領域的開發。是指用簡明的圖形、表格、文字等形式描述技術變革的步驟或技術相關環節之間的邏輯關系。路線圖是壹個目標計劃,列出了未來要做的事情,直到達到某個目標,就像沿著地圖路線壹步壹步尋找終點壹樣,所以叫路線圖。

企業中數據治理實施的路線圖

企業數據治理實施路線圖以企業數據戰略——願景與使命為綱領,以緊急優先原則和分步實施策略為總體設計和規劃。實施路線圖主要包括:分幾個階段實施,每個階段的目標、工作內容、時間節點要求、環境條件。作者觀點:任何企業的數據治理都不是壹蹴而就的,需要循序漸進,不斷優化!實現路線圖就是基於這壹點,所以也是說服涉眾支持的重要手段。

目標:確定數據治理的階段以及每個階段的目標;

技術工具:路線圖方法

輸入:數據治理成熟度能力、業務影響和實施優先級的評估結果;

輸出:數據治理實施路線圖或階段目標計劃。

7.為數據治理制定詳細的實施計劃。

數據治理的詳細實施計劃用於指導主數據的實施,壹般包括三個方面:數據治理核心領域、數據治理支撐體系和數據治理項目管理。

數據治理的總體框架圖

數據治理的核心領域包括:數據架構、數據服務、元數據管理、數據質量管理、數據標準管理、主數據管理、數據安全管理和數據生命周期管理。

數據治理支撐體系包括:組織(組織架構、組織層級、工作職責)、系統(管控模式、規章制度、考核機制)、流程(歸口部門、管理流程、流程任務等)。)、技術(數據集成、數據清洗、數據開發、數據應用、數據運營、支撐平臺、實施方案等。).

數據治理的項目管理方案包括:項目團隊、項目計劃、質量保證計劃、配置管理計劃、培訓和售後。

數據治理的核心領域,請參考筆者分享的數據治理框架解讀系列文章。

關於數據治理的支撐體系,請參考我之前分享的關於成功數據治理關鍵要素的系列文章。

目標:根據數據質量、業務影響和實施優先級評估結果的根本原因分析,制定詳細的實施計劃;

輸入:業務影響和實施優先級評估結果、行動路線和計劃;

輸出:數據治理的詳細實施計劃。

8、數據治理實施過程控制

數據治理實施的過程控制是控制數據治理項目的範圍、進度、質量和成本,通過合理協調和利用企業的各種資源來實現數據治理目標的各種措施。從項目管理的角度來看,也是項目管理的金三角:範圍、時間、質量、成本。

任何項目的質量和進度都需要良好的項目管理來保證,數據治理也是如此。與傳統軟件工程項目不同,數據治理項目具有範圍邊界模糊、影響範圍廣、難以短期見效、實施周期長的特點:

①範圍邊界模糊,涉及數據治理的很多關鍵領域,如元數據管理、數據質量管理、數據標準管理、主數據管理等。,是重疊的,所以很難界定邊界。比如數據質量管理項目的實施會涉及元數據管理和數據標準管理,同樣的元數據管理項目也會涉及數據標準和數據質量。

(2)影響範圍廣,數據治理的實施不是壹個部門能完成的。它需要高級管理層、業務部門和信息部門的共同努力。

(3)短期內很難出成果。數據治理項目實施後,數據治理的效果被每壹個業務操作“稀釋”,不像BI等其他項目那樣明顯,所以領導數據治理的部門往往會受到質疑。

④實施周期長,沒有明確的數據治理目標和範圍協議,數據治理是個“無底洞”。因此,在實施數據治理項目(步驟6和7)之前,制定實施路線圖和詳細的實施計劃尤為重要。

目標:通過數據治理項目實施過程中的進度控制、質量控制和成本控制,實現數據治理的目標;

技術工具:PP(項目規劃)、PMC(項目控制)、IPM(綜合項目管理)、RSKM(風險管理)-CMMI過程域;

輸入:步驟6-7的輸出:數據治理的實施路線圖和數據治理的詳細實施計劃;

輸出:各種項目控制措施,如項目計劃、SOW、項目風險清單、項目報告、項目總結等。

9.監控和評估數據治理的實施效果。

隨著大數據技術的不斷發展,需要從企業整體數據治理環境的角度,明確數據治理關鍵技術的應用及其標準和規範,構建有效性評估的指標體系,評估治理效果;並利用數據治理能力成熟度模型重新評估和定義數據管理的水平,使跨系統、跨業務、跨部門的數據治理體系的建設和實施能夠通過各方的合作順利進行,實現卓越的數據治理,進而企業通過數據驅動業務、數據驅動管理和運營來降低成本、提高效率、提高質量、進行創新。

企業中的數據治理看板(數據脫敏)

數據治理效果的評價指標體系應根據企業和數據治理項目的實際情況制定,壹般包括及時性、數量性、完整性和準確性四個維度。

①及時性是指數據的及時性。這個維度主要通過源業務系統中數據訪問的上報和訪問的及時性來檢查。通過分析月指標、周指標、日指標的數據時效率,得出在指定時間和頻率周期內訪問系統的比例,從而反映數據訪問的時效性。

②定量。該維度從數據存量、數據增量、數據訪問、數據交換、數據使用等指標反映數據的使用情況,可分為月指標、周指標、日指標、分時指標。

③準確性。這個維度主要由邏輯的準確性、數據值的準確性、數據帶和字段之間的準確性、數據的準確性組成。準確度還包括:月、周、日等準確度指標。?

④完整性。該維度主要從單位維度完整性、數據業務維度組合完整性、指標值完整性等方面進行檢查。它是驗證數據質量完整性的主要組成部分,包括月指標、周指標和日指標的完整性。?

目的:測試各項數據治理指標的落實情況,查漏補缺,鞏固數據治理效果;

技術工具:數據治理效果評估指標體系,各種數據圖表工具;

輸入:數據治理效果評價指標;

輸出:數據治理評估月報、周報、日報;

10,持續改進數據治理

數據治理模型應該是可操作的和正常的,而不應該是壹個項目或“壹陣風”模型。

圖片來自網絡。

要像企業生產銷售壹樣,把數據治理作為重點業務來進行,建立專業的數據治理機構,設置適當的崗位職責,建立相應的管理流程和制度,讓數據標準落實到每壹個業務環節,形成工作常態。在我看來,加強數據源頭對企業數據的治理,讓常態化治理成為日常業務,才能從根本上徹底解決企業數據質量的各種問題,真正將數據轉化為企業資產,從而達到數據驅動流程優化、數據驅動業務創新、數據驅動管理決策的目的。

目標:規範數據治理,持續提升數據質量,推動流程優化和管理創新。

投入:持續、規範、標準的業務運營;數據治理監控的指標和報告;

輸出:持續輸出高質量數據;

博主觀點:原理大家都懂,實踐起來困難重重。在專家的指導下,應用合適的工具可以將理論變成現實。華聚科技,專業的數據治理服務和技術提供商。

  • 上一篇:求法律實務案例分析,最好是刑事訴訟法。
  • 下一篇:中國有哪些規範網絡市場的法律?
  • copyright 2024法律諮詢服務網