tft每日頭條

 > 科技

 > 數據治理成功的六大要素

數據治理成功的六大要素

科技 更新时间:2024-11-25 01:30:33

進入數據時代,“數據是公司的核心資産”已經成為企業共識,如何有效利用數據資産發揮數據價值,面臨的首要問題是“企業到底有哪些數據、數據在哪裡、數據長什麼樣”。說起資産盤點,我們總會聽到很多概念:數據資源目錄、數據架構、數據分布、數據流向、數據模型,那麼:

數據資源目錄與數據模型什麼關系?

數據資源目錄與數據架構什麼關系?

數據模型與業務域什麼關系?

數據模型與數據架構什麼關系?

數據資源目錄與業務域什麼關系?

……

數據治理成功的六大要素(數據治理科普數據架構)1

數據架構企業數據的總藍圖

建築架構 VS 數據架構

随着人們對建築需求的增多,使得空間劃分和組合的方式也多了起來。需要區分廚房、書房、卧室、客房等,怎樣南北通透、怎樣避震效果好……,簡單點理解,這就是建築架構師的工作。優秀的建築架構師還會思考:“在這棟建築建成後的漫長歲月裡,人們會如何使用并提升幸福感?”

建築架構的目的是讓房子更宜居,數據是業務的映射,同樣地數據架構的目的是讓數據的理解、使用更順暢。因此,無論是DAMA還是《華為數據之道》都指明,數據架構的目的就是“确保各類數據在企業各業務單元間高效、準确地傳遞,上下遊流程快速地執行和運作”。

數據架構定義了對組織非常重要元素的标準術語和設計。企業數據架構的設計包括業務數據描述,如數據的收集、存儲、整合、移動和分布。當數據在組織中通過源或接口流動時,需要安全、集成、存儲、記錄、分類、共享的報表和分析,最終交付給利益相關方使用。在這個過程中,數據可能會被驗證、增強、鍊接、認證、整合、脫敏處理以及用于分析,直到數據被歸檔或清除。企業數據架構描述必須包括企業數據模型和數據流設計。 【DAMA數據管理知識體系指南DAMA-DMBOK2】

數據模型:促進業務與技術的有效溝通

數據模型是使用結構化的語言将收集到的組織業務經營、管理和決策中使用的數據需求進行綜合 分析,按照模型設計規範将需求重新組織。 從模型覆蓋的内容粒度看,數據模型一般分為主題域模型、概念模型、邏輯模型和物理模型。

主題域模型是最高層級的、以主題概念及其之間的關系為基本構成單元的模型,主題是對數據表達事物本質概念的高度抽象;

概念模型是以數據實體及其之間的關系為基本構成單元的模型,實體名稱一般采用标準的業務術語命名;

邏輯模型是在概念模型的基礎上細化,以數據屬性為基本構成單元;

物理模型是邏輯模型在計算機信息系統中依托于特定實現工具的數據結構。

從模型的應用範疇看,數據模型分為組織級數據模型和系統應用級數據模型。組織級數據模型包括主題域模型、概念模型和邏輯模型三類,系統應用級數據模型包括邏輯模型和物理數據模型兩類。【《GB/T36073—2018 數據管理能力成熟度評估模型》】

數據治理成功的六大要素(數據治理科普數據架構)2

數據治理成功的六大要素(數據治理科普數據架構)3

制造業典型數據模型示例

1、主題域模型

主題:是在較高層次上講企業的數據進行歸類、分析的抽象概念,每一個主題通常對應一個宏觀層面的業務領域/業務闆塊。

主題域:是企業數據組織的重要分類方式,也是數據認責的一個重要維度。主題域的劃分,通常遵循“不交叉、不重疊、不遺漏”原則。

數據治理成功的六大要素(數據治理科普數據架構)4

某制造業主題域模型示例

2、概念模型

概念模型,是對主題域模型的進一步細化,定義了企業内主要業務實體及實體之間的業務關系(E-R圖),不描述業務實體的數據屬性。

實體:是客觀存在并可相互區别的事物。實體應包含描述性信息,如果一個數據元素有描述型信息,該數據元素應被識别為實體。如果一個數據元素隻有一個标識名,則其應被識别為屬性。

數據治理成功的六大要素(數據治理科普數據架構)5

研發管理域實體示例

數據治理成功的六大要素(數據治理科普數據架構)6

生産準備域概念模型示例

3、邏輯模型

邏輯模型:是對概念模型的進一步分解和細化,需要通過關鍵數據屬性描述更多的業務細節,包括實體、屬性以及實體關系。

邏輯模型通常包括關鍵的數據屬性,不是全部的實體和全部的屬性。關鍵數據屬性,是指如果缺失,企業業務将無法運轉,它的識别和設計具有一定的主觀性,需要依托企業運行的業務流程及業務活動判斷

數據治理成功的六大要素(數據治理科普數據架構)7

質量管理某子主題的邏輯模型

特别強調,通常情況下,各類數據項目開展過程中所說的數據架構設計是指主題域模型設計、概念模型設計、邏輯模型設計,而物理模型設計通常是數據建模的産出物。

數據流向:描述數據的“來龍去脈”

數據流向用于描述數據如何在業務流程和系統中流動。端到端的數據流包含了數據起源于哪裡,在哪裡存儲和使用,在不同流程和系統内或之間如何轉化。數據流可以通過二維矩陣或者數據流圖的方式呈現

通過數據流向的梳理,明确數據的“數據源頭”,業務上首次正式發布該項數據的應用系統,配合數據管理組織的認證,作為企業範圍内唯一的數據源頭被周邊系統調用。

數據治理成功的六大要素(數據治理科普數據架構)8

業務域間流向示例

數據治理成功的六大要素(數據治理科普數據架構)9

系統間流向示例

數據資源目錄:數據盤點的成果物

想象下,在圖書館查找某一圖書時,怎麼樣最快的了解它的版本、位置以及出版社、主編等信息。企業數據目錄之于數據,正如圖書目錄之于圖書,數據資源目錄是一個完善企業資産地圖,也為企業數據治理提供了指引,數據資源目錄需要能夠回答“企業數據有哪些”、“企業數據如何分布”、“企業數據在哪裡”、“企業數據長什麼樣”等問題。

數據資源目錄需要對數據進行歸類,以方便數據使用人員快速找到數據、理解數據。數據資源目錄的歸類可以按照業務維度、數據結構類型維度(結構化、非結構化、半結構化)、業務系統維度等,大部分實際項目的落地過程中,我們會選擇主題域維度,這是企業組織數據、使用數據最方便、快捷、易懂的一個維度。《華為數據之道》的數據資産目錄涵蓋了華為公司的所有業務數據資産,也是将業務主題域分組作為了描述公司數據管理的最高層級分類,書中提到“業界通常有兩種數據資産分類方式,基于數據自身特征邊界進行分類、基于業務管理邊界進行分類。華為公司為了強化企業内業務部門的數據管理責任,更好地推進數據資産建設、數據治理和數據消費建設,采用業務管理邊界劃分方式。”

數據資源目錄五層體系包括主題域→主題→業務對象→實體→屬性。

數據治理成功的六大要素(數據治理科普數據架構)10

數據分層結構

以生産制造為例:

L1主題域為“生産制造管理域”;

L2主題可細化為“生産計劃管理”、“制造執行管理”、“外協管理”、“設備管理”;【實際項目落地過程中,主題有可能會再劃分,出現子主題,需要根據實際業務的複雜程度确定】。

L3業務對象可包含“物料需求計劃”、“外協計劃”、“領料單”、“車間計劃”、“生産進度信息”、“設備維修維護信息”、“産品”等;

L4實體可以為“産品基本信息”、“産品生産信息”、“産品質量信息”等;

L5屬性為産品基礎信息中包含的“産品代碼”、“産品名稱”等。

那麼,數據資源目錄與數據模型有沒有關系呢?

實際上,數據資源目錄是對企業數據的一種組織維度,而前面講到,業務是最容易理解的一個維度,所以它可以沿用數據模型的一些層級。比如:L1主題域、L2組主題沿用主題域模型即可;L3業務對象、L4實體也會引用概念模型設計階段識别的實體等等。

結尾

至此,我們講清楚了數據架構包括的數據模型與數據流向,也闡述了數據資源目錄的用途及通常組織方式。

那麼,問題來了:

主題域應該如何劃分呢?

實體是不是等同于表單呢?

邏輯模型的關鍵屬性依據是什麼呢?

數據流向是怎麼畫出來的?

數據資源目錄應該如何梳理呢?

……

下期見!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved