tft每日頭條

 > 科技

 > 圖數據庫與關系型數據庫

圖數據庫與關系型數據庫

科技 更新时间:2024-07-27 05:15:27
私信我或關注猿來如此呀,回複:學習,獲取免費學習資源包。

數據庫(Database)是按照數據結構來組織、存儲管理數據的倉庫

數據庫本身隻是一個倉庫,隻不過不是像我們實物産品那樣的産品倉庫,是用于存放數據的地方。

而數據,要像生産企業産品那樣,做到5S管理,那數據的存放,是需要有結構化的,有組織地進行才可以。

這是重點,也是在建立數據庫之前,需要了解,并理解需求後,建立數據關系。

數據庫的核心和基礎是數據模型

通常也按照數據模型的特點将傳統數據庫系統分成網狀數據庫、層次數據庫和關系數據庫三類。

這三類,也可以叫做網關數據模型,層次數據模型,關系數據模型。

圖數據庫與關系型數據庫(數據庫網狀數據庫)1

關系數據庫由于具有嚴格的數學理論基礎,抽象級别比較高,而且簡單清晰,便于理解和使用,使用戶能夠邏輯地、抽象地處理數據而不必關心數據在計算機中的物理表示和存儲,因此關系型數據庫得到了迅速發展并成為主流的數據庫模型。

了解數據模型的分類,重點是為何關系數據模型得到了迅速發展。因為通過數據間的“關系”,“關聯”就可以調用各個表,進行搜索,處理,顯示需要的數據,進行分析處理。

大部分數據庫設計産品使用 E-R 圖幫助用戶進行數據庫設計。它用矩形表示實體(Entity),用橢圓表示實體的屬性,用菱形表示實體之間的關系(Relationship),在實體、屬性和關系之間用直線相連并在直線上标注關系的類型(一對一關系、一對多關系或多對多關系)。在實際使用 E-R 圖時,有時候會忽略實體的屬性(可以由範式化實現),僅保留實體之間有聯系的屬性。

數據看似隻是數據,但每個數據都代表着一定的意義,所代表的,就要就是實體,而實體就會有屬性,而要把很多的實體通過一定的關系,進行處理,分析,顯示,就需要把這種關系進行梳理,建立連接。

而關注的類型就産生了,一對一,一對多,多對多。

數據庫的應用類型分為 OLTP(Online Transaction Processing ,即聯機事務處理)和 OLAP(Online Analysis Processing,即聯機分析處理)兩種。

OLTP 是傳統關系型數據庫的主要應用,其主要面向基本的、日常的事務處理,例如在線交易。它的基本特征是可以立即将客戶端的原始數據傳送到計算中心進行處理,并且在很短的時間内給出處理結果。衡量 OLTP 系統的一個重要性能指标是系統性能,具體體現為實時響應時間(Response Time),即從用戶在終端輸入數據到計算機對這個請求做出回複所需的時間。

OLAP 是數據倉庫系統的主要應用,支持複雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果。OLAP 專門用于支持複雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以根據分析人員的要求快速、靈活地進行大數據量的複雜查詢處理,并且以一種直觀易懂的形式将查詢結果提供給決策人員。為了讓用戶從多個角度切換或者進行多角度綜合分析,OLAP 數據庫通常使用一個或多個多維數據集(Multi Dimensional Dataset),并且使用 MDX(Multi Dimensional Expressions,即多維表達式)進行數據定義和操作。

一個是反饋,一個是顯示結果,幫助分析。

SQL 中包括3類語言:

DML(Data Manipulation Language,即數據操縱語言)。它們用于對數據庫裡的數據進行操作,例如 SELECT、UPDATE、INSERT、DELETE、TRUNCATE、MERGE 等語句。

DDL(Data Definition Language,即數據定義語言)。它們用在定義或改變數據庫和表的結構、數據類型、約束等初始化工作上,大多在建立表時使用。主要的命令有 CREATE、ALTER、DROP 等。

DCL(Data Control Language,即數據控制語言)。它們用來設置或更改數據庫用戶或角色權限的語句,包括 Grant、Deny、Revoke 等語句。

微軟公司的數據庫産品命名為 SQL Server,也稱 MS SQL Server。

所以寫MSSQL,代表的就是SQL Server

SQL Server 是世界上用戶最多的數據庫管理系統,是一個即可以支持大型企業級應用,也可以用于個人用戶甚至移動端的數據庫軟件。它不僅僅是一個常規的數據庫引擎,而且内置了數據複制功能、強大的管理工具、與 Internet 的緊密集成和開放的系統架構,因此 SQL Server 定位于為廣大的用戶、開發人員和系統集成人員提供了一個可靠、高性能、集成的數據平台。

圖數據庫與關系型數據庫(數據庫網狀數據庫)2

2000年8月,SQL Server 2000 發布。這次引入了對多實例的支持,并且允許用戶選擇排序規則。在分析服務中也出現了數據挖掘。用戶還可以從網上下載一個制作和發布報表的插件(後續版本稱之為報表服務)。

SQL Server 2005 又是一次重大的架構變革,原有的許多方面都被重寫了,從而可以為用戶提供完整的數據庫解決方案,并幫助用戶建立商業智能方案。具有代表性的新功能有:

◆ 支持非關系型數據作為XML儲存與查詢

◆ 使用SQL Server Management Studio代替了舊版本的企業管理器

◆ 使用SQL Server 集成服務代替了舊版本的DTS

◆ 支持使用CLR(Common Language Runtime)創建對象

◆ 增強了T-SQL語言,包括結構化的異常捕獲

◆ 引入了DMV(動态管理視圖),可實現詳細的健康監視、性能調整和故障排除

◆ 增強的高可用性,引入了數據庫鏡像

◆ 增強了安全性,支持列加密

◆ 以 SQL Server Express 版本代替 MSDE

SQL Server 2008 作為上一代産品的升級強化版,使 SQL Server 的性能更強大、功能更全面、安全性更高。其主要的新功能有:

◆ 引入“Always On”技術,減少潛在的停機時間

◆ FileStream 支持結構化與半結構化的文件流數據

◆ 引入了空間數據類型

◆ 添加了數據庫壓縮與加密技術

◆ 引入了與日期、時間相關的特殊數據類型,包括在日期時間數據中支持時區

◆ 全文索引被直接集成到數據庫引擎中

◆ 引入了基于策略的管理框架,取代了舊版本的基本腳本的管理

◆ 引入了用于 SQL Server 的 PowerShell 提供程序

SQL Server 2008 R2 是 SQL Server 2008 之後的一個次版本,于2010年4月正式發表。主要增強了以下功能:

◆ 增強了報表服務,通過新的報表設計器可以制作地圖報表

◆ 引入了 PowerPivot 高級分析能力,包括 PowerPivot for Excel 和 PowerPivot for SharePoint

◆ 增強了多服務器管理能力

◆ 引入主數據服務,支持管理參照數據

◆ 引入 StreamInsight,在将數據儲存到數據庫之前高速查詢數據

◆ 引入數據層應用程序,幫助将數據庫應用程序打包作為應用程序開發項目的一部分

SQL Server 2012 是微軟在2012年推出的一個重大的産品,專門針對關鍵業務應用的多種功能與解決方案可以提供最高級别的可用性與性能。它推出了以下新特性和關鍵的改進:

◆ 繼續增強了報表服務,Power View可以實現更酷更炫的報表

◆ 增強了集成服務的功能

◆ 将表格數據模型引入到分析服務

◆ 商業智能項目被遷移到 Visual Studio 2010

◆ 高可用性增強,引入了 Always On 可用性組的功能

◆ 引入了數據質量服務

◆ 增強了 T-SQL 語言,例如添加了 sequence 函數、新的錯誤捕獲、新的開窗函數

◆ 引入了 FileTable,擴展了FileStream的功能

◆ 引入了統計語義搜索

◆ 增強了内置工具,例如提供了數據庫恢複顧問

1.2.7 SQL Server 2014

SQL Server 2014 可以滿足企業當前的業務需求,并提供更高的可靠性和性能。它的主要新特性如下:

◆ 提供内存 OLTP 功能,以顯著提高數據庫應用程序的性能

◆ 可更新的列存儲

◆ 可以将 SSD 作為數據庫緩沖池擴展

◆ AlwaysOn 可用性組支持多達 8 個輔助副本

◆ 故障轉移群集實例支持 Windows 群集共享卷,不再強制要求使用共享存儲

◆ 改進單個分區在線索引重建和管理表分區切換的鎖定優先級

◆ 在内部部署和 Windows Azure 中提供備份加密支持。

◆ 資源調控器的資源池支持為每個卷配置最小和最大 IOPS

◆ 支持本地 SQL Server 與 Windows Azure 混合部署方案

1.2.8 SQL Server 2016

SQL Server 2016 是 SQL Server 家族中最新的産品。主要有以下新特性和關鍵的改進。

◆ 全程加密技術,支持客戶端應用所有者控制保密數據

◆ 動态數據屏蔽,使未授權用戶隻能看到未屏蔽的部分數據

◆ JSON 支持

◆ 支持 R 語言

◆ 支持内部數據庫擴展到 Azure SQL

◆ 提供了曆史表,保存了基表中數據的舊版本信息

◆ 純 64 位軟件,不再支持 32 位操作系統

SQL Server 不僅僅是數據庫的概念,除了提供數據庫引擎之外,還有一套完整的商業智能解決方案。開發和使用商業智能需要使用 SQL Server 的另外三個服務:

  • 集成服務(SQL Server Integration Services,簡稱 SSIS)
  • 分析服務(SQL Server Analysis Services,簡稱 SSAS)
  • 報表服務(SQL Server Reporting Services,簡稱 SSRS)

ETL是從基于OLTP的數據庫到OLAP的數據倉庫數據提取、清洗、轉換、裝載的過程。

SSIS是SQLServer Integration Services的簡稱,可以使用SSIS來創建ETL包,執行上面的轉換操作。

SSAS是SQL SERVER Analysis Services的簡稱,可以創建多維度數據庫并提供服務。

SSRS可以提供報表服務

SSIS 是 ETL工具

SSAS 是 Cube(多維數據庫)工具

SSRS 是 報表工具

SSIS 把 數據庫 的數據抽取到 數據倉庫

SSAS 把 數據倉庫轉換成 多維數據庫

SSRS 用 多維數據庫作為數據源來呈現報表

實例可以看作是 SQL Server 中最大的一個容器,每個實例都包含了自己獨立的一套組件與服務。如下圖所示。

圖數據庫與關系型數據庫(數據庫網狀數據庫)3

還是那一句,數據,不隻是單單的數據,數據隻是最基礎的信息,通過這些信息,按要求進行處理,分析,生成報表,報告,就可以進行一定的決策幫助,而決策,就可以針對潛在需求,市場的發展方向,起到指導作用。

SQL Server 2000 開始支持在一台計算機安裝多個實例。SQL Server 2008(企業版)及後續版本最多可以在一台計算機上安裝50個實例。

每個實例都必須有一個唯一的名稱。根據實例名稱的類型,可以分為默認實例和命名實例兩類。每台計算機中最多可以有一個默認實例,也可以全部都是命名實例。

◆ 如果在安裝 SQL Server 時選擇安裝“默認實例”就可以使用默認的實例名。SQL Server 默認使用“MSSQLSERVER”作為默認實例的名稱,但客戶端在連接時不需要指定這個名稱,隻需引用計算機名即可。

◆ 如果在安裝時選擇“命名實例”,就需要為該實例指定一個名稱。在客戶端在連接到命名實例時,不僅需要指定計算機名,還要指定這個實例的名稱

使用多實例的場景有:

◆ 不同的實例對應不同的服務等級(例如響應時間、無故障時間)。

◆ 不同的實例對應不同的 SQL Server 版本。在版本升級時常用這種方式。

◆ 有不同的數據庫管理員和不同的用戶,隻允許他們管理和訪問其中部分的數據庫。

◆ 不同的實例對應不同的配置選項。

數據庫引擎是 SQL Server 用于存儲、處理和保護數據的核心服務。使用數據庫引擎可以創建用于OLTP(聯機事務處理)或 OLAP(聯機分析處理)的關系數據庫。這包括存儲數據的表和用于查看、管理和保護數據安全的數據庫對象(如索引、視圖和存儲過程)。

SQL Server 2008 及後續産品取消了通知服務(Notification Services),以 Service Broker 代替。這是一個重要的外圍組件,它包括提供消息隊列和消息傳遞功能。消息隊列可以保存查詢和其它請求。消息傳遞允許數據庫應用程序之間異步通信。可以對會話設定不同的優先級,以保證消息合理的處理順序。

複制(Replication)用于跨越多個數據庫分發數據,可以作為提高數據庫的可用性的一種解決方案,也是讀取異地數據庫、實現負載平衡的一種途徑。

在 SQL Server 2005 中,全文搜索(Full-Text Search)仍然還是一個的外圍組件,這是一個基于操作系統級别的服務,數據庫引擎通過接口訪問這個服務。SQL Server 2008 已經将其集成到數據庫引擎中,稱為全文索引(Full-Text Index)。

在 OLTP 關系型數據庫中,關系可以看成由行和列交叉組成的二維表格,大緻可以理解為 Excel 表格的形式。

SQL Server 7.0 提供了 OLAP 功能,引入了多維數據集,從而實現快速訪問數據倉庫中的數據。

SQL Server 2000 提供了數據挖掘功能,用戶可以在 OLTP 或 OLAP 中定義各種多維模型,模型中包含了分組和預測規則。通過使用多維表達式(Multidimensional Expression,簡稱 MDX)語言訪問多維數據集,從而實現複雜的數據分析。

SQL Server 2012 為分析服務引入了表格數據模型。與多維模型不同,表格數據模型仍然将數據組織為包含行與列的表格,這與關系數據庫非常類似。表格模型使用數據分析表達式(Data Analysis Expression,簡稱 DAX)訪問數據。實際上在 SQL Server 2008 R2 的 PowerPivot for Excel 和 PowerPivot for SharePoint 中就已經引入了表格數據模型。

SQL Server 2012 引入了商業智能語義模型(BI Semantic Model),在 SSAS 和 PowerPivot for Excel 中創建統一模型,将強大的多維分析技術與常見的表格格式數據模型緊密結合,從而實現分析模型創建與消費的靈活性。

SQL Server 2012 還提供了統計語義搜索。它以全文搜索功能的“詞”為基礎,但允許超出關鍵字搜索範疇從非結構化的文檔中查詢“含義”。

SQL Server 2014 增加了用于多維模型的 Power View。

圖數據庫與關系型數據庫(數據庫網狀數據庫)4

集成服務可以幫助用戶構建全面的企業級分析解決方案,通過熟悉的工具進行可行性分析。

QL Server 2005 及後續版本用 SSIS 替代了 DTS。SSIS 可以從多個異構數據源提取、轉換、合并數據,并移動或複制到一個或多個目标。

SQL Server 2014 的 SSIS 與 SQL Server 2012 并無不同。

SQL Server 2008 改進了 SSRS 的處理能力和性能,使得大型報表不再耗費所有可用内存。還包含了跨越表格和矩陣的 TABLIX。Application Embedding 允許用戶點擊報表中的 URL 鍊接調用應用程序。

此時,SSRS 實現了與 Microsoft Office 2007 完美地結合。例如,SSRS 能夠直接把報表導出成為 Word 文檔。而且使用 Report Authoring 工具,Word 和 Excel 都可以作為 SSRS 報表的模闆。

根據報表服務的發展趨勢,随後推出的 SQL Server 2008 R2 支持 SQL Azure、SQL Server PDW、SharePoint 列表、PowerPivot 作為數據源。還在報表中增加了地圖功能。并推出功能更強的 Report Builder 3.0 報表設計器。

SQL Server 2012 推出了 Power View。這是一款可以運行在遠程數據庫報表客戶端,可以通過web 服務對 SQL Server 數據庫進行調用。Power View 沿用 Ribbon 設計風格,支持類似與微軟 Office Excel 的交互風格,允許設置多種過濾器、高亮顯示以及全屏顯示等功能。可以輕松導出數據報表到PowerPoint 頁面,通知支持發布報表到 SharePoint 2010 服務器。Power View 是基于微軟的 Silverlight 技術平台,且必須與 SharePoint 2010 企業版集成部署。

圖數據庫與關系型數據庫(數據庫網狀數據庫)5

開發版(Developer Edition)具有企業版的所有功能,但是不能用于生産服務器,隻能用于開發和測試環境。它是開發和測試人員的理想之選,可以基于 SQL Server 構建任意類型的應用程序。

并行數據倉庫(Parallel Data Warehouse,縮寫為 PDW)版本針對具有海量數據的數據倉庫提供了一種全新的架構,可以為數據庫實現從幾十到幾百 PB 的擴展。由于這個版本是基于某幾款服務器硬件而設計的,因此需要成套購買指定的軟件和服務器。

Express 版(Express Edition,也稱速成版)是一個入門級的免費版本,非常适合用于開發和支持桌面、Web 和小型服務器應用程序。

RAID(Redundant Array of Independent Disks,磁盤陣列)是将一組磁盤組合為磁盤組。

目的是,配合數據分散排列的設計,提升數據的安全性和加快讀取速度。

◆ RAID-0 即數據條帶化(Data Stripping)技術,它在最少2塊硬盤組成的磁盤組上創建帶區集。在使用時,數據被分散到所有的硬盤中同時進行讀寫,因此它可以幾乎成倍地提升數據讀取速度,但它沒有數據冗餘功能,因此算不上真正的 RAID 結構。RAID-0 僅在一些對數據安全性要求不高卻又希望提升數據讀寫能力的場景中。

◆ RAID-1 即磁盤鏡像,它将一塊磁盤的數據鏡像到另一個磁盤上。在寫入數據時,會在另一塊磁盤上同時寫入,隻要系統中任何一對鏡像磁盤中至少有一塊磁盤可用,系統都可以正常運行,保證數據的絕對安全。但是這樣也會使成本明顯增加,磁盤利用率為50%。因此,RAID-1 多用于保存關鍵性重要數據的場合。

◆ RAID-5 是帶有分布式奇偶校驗的磁盤組,它不是将數據直接鏡像到另一塊磁盤,而是将在所有磁盤上交叉地存取數據及奇偶校驗信息,在讀取數據時有接近于 RAID-0 的速度。但是在寫入時需要讀取舊的奇偶信息并寫入新的奇偶校驗碼,導緻寫入的效率會有損失。如果其中一塊磁盤損壞,可以通過奇偶校驗碼完成修複工作。RAID-5 最少需要3塊磁盤,利用率為 n-1(n為磁盤數量)。

圖數據庫與關系型數據庫(數據庫網狀數據庫)6

◆ RAID 0 1 或者 RAID 1 0 從名稱上可以看出是 RAID-0 和 RAID-1 的結合體,它在磁盤鏡像中建立帶區集,從而同時擁有 RAID-0 的超凡速度和 RAID-1 的數據高可靠性。RAID 0 1 至少需要4塊磁盤,利用率為50%。硬件廠家支持 RAID 1 0 的比較普遍,通常稱之為 RAID-10。

RAID 通常通過硬件實現,Windows 7 和 Windows Server 2008 也提供軟件 RAID 功能。具備 RAID-0、RAID-1 和 RAID-5 功能的卷分别稱之為帶區卷、鏡像卷和 RAID-5 卷。

圖數據庫與關系型數據庫(數據庫網狀數據庫)7

來源網絡侵權聯系删除

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved