使用建立模型的方式對事物進行描述,可以更形象、直觀地揭示事物的本質特征,幫助人們更加全面、深入認知事物,找到事物的解決方案。在生産生活中,為了便于使用計算機技術對客觀事物進行管理,就需要對客觀事物進行抽象、模拟。而數據模型正是對現實世界數據特征的模拟和抽象,是用于提供信息表示和操作手段的形式構架。
一、什麼是數據模型?
數據建模設計,可以通過對不同系統的分析、預測,實現對系統的最優控制。恰當合理、符合規範的數據模型,能夠使企業内數據的分布更加科學,大幅提升數據使用率。
二、數據模型對于數據治理的重要性
數據模型,是體現企業核心數據需求的重要元數據的集合。在數據質量方面,它可以通過提供關鍵的元數據和業務規則輸入,推動企業數據質量評估規則和數據标準的優化和建設;在數據安全方面,數據模型可按需标注敏感信息,方便組織參考制定數據安全規則,判斷數據權限設置和脫敏需求;在數據存儲方面,數據模型提供的規範結構可以大大減少數據存儲操作時出現異常的情況;在數倉和BI的建設方面,數據模型可提供的整體數據視角和專業維度模型必不可少。
在數據治理工作中,總結問題并定義關鍵數據後,可通過在數據模型中構建相應的治理政策和安全規程,控制安全問題的發生。安全、透明、合理、規範的數據建模過程可以加強數據的安全性,提高數據使用率和整合效率。
構建數據模型體系是數據治理工作的重要部分,需要在确定統一标準和技術規範的基礎上,在解決現實問題的同時,充分考慮未來的發展預期和可能出現的問題。
三、數據模型體系如何構建
1、數據模型體系的結構
數據模型體系是數據的核心部分,也是數據生命周期的起點。數據模型體系結構具體可參考下圖(圖一):
2、數據模型體系設計的原則
在設計數據模型體系時,應充分借鑒國際上、行業内的成熟經驗,确保設計成果的先進性、可靠性,再根據企業需求形成企業自身獨有的數據模型體系。同時,數據模型設計應的相對穩定,支持模型的擴展與優化,進而保證企業信息資源的可持續利用。
(1)數據編碼原則
● 唯一性:同一系統内一個編碼隻能代表一種對象,避免一“物”多碼和一碼多“物”現象;
● 完整性:原則上,企業所有的對象都應編碼。以保持編碼的完整性;
● 準确性:對編碼的定義和描述必須簡潔準确,不能模棱兩可。對于易變動的屬性應通過獨立的數據項進行描述;
● 适應性:設計編碼規則時,應全面考慮各個組織、業務域使用者的需求;
● 繼承性:盡量沿用已普遍使用的編碼,有選擇性地借鑒國标行标編碼;
● 拓展性:設計編碼結構和位數容量時要考慮未來業務、運營、管理的發展變更,預留編碼擴展空間;
● 穩定性:編碼要統一且有一貫性,編碼及編碼規則一經确定,不可輕易更改,以免造成數據混亂和丢失;
● 易用性:編碼應盡量簡短,規則應盡量簡單,易于聯想和錄入,方便對數據的維護和使用。
(2)數據分類原則
● 維度一緻:同一類别結構中,劃分維度和标準要保證全部統一,不允許出現不同标準的分類方式;
● 粒度統一:一個完整的類别結構中,應盡量避免相同層級的類别劃分有較大的粒度差别和重疊。類别結構的層次不一,會增加後期管理的難度;
● 避免出現“其他類”:應全面考慮類别的劃分維度和完整性,原則,杜絕出現“其他類”,避免錯放、亂放行為造成編碼混亂;
● 允許多類别結構的存在:在建立類别結構的同時允許舊的類别結構繼續使用,既保證類别結構的科學和完整,又沿襲了傳統習慣,增強項目實施可控性。
3、信息模型體系設計原則
信息模型體系包括:物資數據模型、客戶數據模型和供應商數據模型等。下面以中翰軟件的物資數據模型管理要求(圖二)為例:
數據信息模型,又可被稱作靜态數據中心模型(見圖三),每一類模型都可分為三個部分,即“編碼屬性”“公有屬性”和“私有屬性”。
“公有屬性”中又分為“基礎數據”和“業務數據”。其中,公有基礎數據即傳統定義的“主數據”部分。主數據包含了編碼數據,但是為了更清晰地描述,一般建議專門建立公有基礎數據(主數據)視圖進行區别管理。
對于公有業務數據,其他系統需要引用後才能使用,為了規範管理,避免出現二次輸入的錯誤,公有業務數據也需要單獨建立視圖進行區别管理。
“私有屬性”分為“業務系統私有屬性”和“組織機構私有屬性”兩部分,這裡的私有屬性都屬于基礎數據,不涉及業務數據。私有業務數據是業務系統中的交易性動态數據,無共享性,變化頻率高,需要在後期的BI或者數據中心中單獨管理。
4、要點總結
● 充分調研企業管理體系現狀,結合企業未來的管理目标和規劃;
● 參照國家标準、行業标準、企業現有标準;
● 在企業内廣泛征求各級相關人員的建議和意見,審慎讨論;
四、數據治理中如何實現對數據模型的管理
1、數據模型管理工具
許多企業在進行數據模型的構建與變更工作時,常常因缺失規範的管理流程而飽受诟病。模型構建不經審核、不符合規範、模型變更難以追溯的情況時有發生。
中翰MDC組件,是中翰研發的靜态數據中心管理平台,可滿足企業靜态數據的全面治理,實現多系統、多組織、多維度建模方式。可結合中翰研發的EDP組件(體系構建平台,提供過程管理和知識轉移服務)實現對企業數據模型構建、變更的标準化過程管理。
2、數據模型管理制度&标準規範
中翰軟件将數據質量管理作為工作核心,重視制度保障。多年來,在中翰的幫助下,許多企業根據自身情況建立了相應的數據管理制度。在數據模型管理層面,主要包括:數據模型内容、數據模型管理内容、數據模型管理過程等幾方面内容。
除此之外,中翰十分注重标準層面的數據治理工作,在“模型規範化”版塊下規定了相應的工作範圍和要求。數據治理進入運維階段後,中翰還将數據模型編碼手冊的編制和提供列入标準化運維體系,便于企業進行數據模型的擴展與優化,進而保證企業信息資源的可持續利用。
3、經驗積累
在17年數據治理工作實踐中,中翰通過各類工業企業項目積累了豐富的經驗,收集整理了1000多萬條來自各行業的數據模型,為幫助企業科學合理實現數據模型體系的構建和數據模型的管理打下了堅實的基礎。
(山東中翰軟件有限公司)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!