數據治理必須涵蓋數據的整個生命周期,從數據收集一直到數據管護。在這個生命周期中,數據治理的關鍵方法是什麼?
1.數據模型——做建模
首先,需要由業務人員提出業務需求,并描述業務需求所需的數據内容。其次,通過業務人員及技術人員合作,根據業務對象抽象出數據概念,定義其描述、分類與關系。技術人員根據數據概念描述、分類,抽取出數據實體,并利用ER圖描述其關系。最後,技術人員針對數據庫特性将數據實體物化為數據庫表,支撐實際應用。
2.數據質量——做清洗
由于互聯網及通信技術的飛速發展以及數據量的爆發式增長,各類數據也大規模增長,可依據相關規範對數據質量即數據的及時性、完整性以及準确性進行限制,詳細地通過事前防範、事中監控、事後管控3個時間段進行監督。
3.數據标準——做統一
根據已确定的企業核心邏輯數據模型,将模型中的數據項抽取出來。然後根據預定的業務數據項篩選方法,篩選出需要進行業務定義的數據項。再根據業務對所篩選出的業務數據項進行分類,産生用于通用數據标準及公共代碼定義的數據标準項清單。
而具體的通用數據标準的制定包括定義工作目标、流程、及模版,其分類标準則根據數據在業務中的使用頻度和業務需求,參考業界模型,通過彙總分析,對通用數據進行分類,形成統一的數據标準在數據層面的定義,并以數據項自然分類為基礎,對數據進行分類。
4.主數據清理——做編碼
主數據是描述核心業務實體的數據,是企業内跨業務重複使用的數據,存在于多個異構的應用系統中,是關鍵數據,而不是全部數據;是操作性數據,動态參與業務流程,而不是靜态數據。
在企業中主數據是全員共享,全員服務的重要數據,與其他數據分離,作為單獨的部分進行管理。
5. 數據生命周期——做管理
數據的生命周期包括數據創建、數據使用、數據歸檔、數據銷毀4個階段。而數據在生命周期内有效則可以滿足業務操作和管理分析的需要;滿足對曆史數據查詢相關政策和管理制度的要求;滿足審計管理要求;減少數據冗餘,提高數據一緻性;減少存儲、硬件、運維等方面基礎設施投入;提升應用系統性能,提高響應速度。因此,數據生命周期的管理必不可少。
6. 數據清理——做規格
數據是數據倉庫的靈魂,它不僅提供了數據倉庫中數據結構的邏輯層,也提供了數據倉庫的構建和使用規則。
為了使數據倉庫中各個軟件能夠無縫地合作,必須在數據層進行有效的集成。所以,研究數據的作用與意義相當重要.數據是關于數據的數據,即是對數據資源的描述,按其描述對象的不同可以分3大類:技術數據、業務數據和管理數據。
7. 數據安全——做防範
數據治理的一個重要作用是保障數據的安全。應該從企業級、體系化視角開展數據安全管理頂層設計。數據統一分類分級後,通過數據鑒權來控制某一類數據可以被哪些系統調取,可以被哪些人員查看,可以被哪些部門共享,對不符合權限的對象進行限制,有效的防止數據洩露風險。
關于光點科技
光點科技是一家在政企數據治理、數據中台建設、數據可視化展示分析方面有着豐富經驗的公司。作為國内專業的數據智能解決方案專家,光點科技自成立以來就一直專注于數據産品的研發和落地,服務的客戶涉及智慧城市、園區、政府、集團企業、金融、制造、能源、電信、工程、教育、檢驗檢測等多個行業。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!