數據管理的發展經曆了文件管理和數據庫管理兩個階段。
1.1.1 用文件管理數據
設實現“學生基本信息管理”的應用系統為A1,實現“學生選課信息管理”的應用系統為A2。由于學生選課管理中要用到F1文件中的一些數據,為減少冗餘,假設這個系統使用F1文件中的一些數據。如圖1-1所示為基于文件管理的應用系統結構。
圖1-1 基于文件管理的應用系統結構
假設F1、F2和F3文件分别包含如下信息:
F1文件:學号、姓名、性别、出生日期、聯系電話、所在系、專業、班号。
F2文件:課程号、課程名、開課學期、學分、課程性質。
F3文件:學号、姓名、所在系、專業、課程号、課程名、修課類型、修課學期、考試成績。
我們将文件中所包含的每一個子項稱為文件結構中的一個“字段”或“列”,将每一行數據稱為一個“記錄”。
“學生選課信息管理”的處理過程大緻為:若有學生選課,則先查F1文件,判斷有無此學生;若此學生在F1文件中,則再訪問F2文件,判斷其所選的課程是否存在;若一切均符合規則,就将學生選課信息寫入F3文件中。
文件管理數據有如下缺點。
1. 編寫應用程序不方便
2. 數據冗餘不可避免
3. 應用程序依賴性
4. 不支持對文件的并發訪問
5. 數據間聯系弱
6. 難以按不同用戶的要求表示數據
7. 無安全控制功能
1.1.2 用數據庫管理數據
如将數據庫管理與文件管理在數據的局限性方面進行比較,數據庫管理具有以下優點。
1. 相互關聯的數據集合
2. 較少的數據冗餘
3. 程序與數據相互獨立
4. 保證數據的安全可靠
5. 最大限度地保證數據的正确性
6. 數據可以共享并能保證數據的一緻性
1.2 數據與數據模型數據是我們要處理的信息,數據模型是數據的組織方式。
1.2.1 數據
描述事物的符号記錄稱為數據,而将一行數據稱為一條記錄。數據是信息存在的一種形式,隻有通過解釋或處理才能成為有用的信息。
從現實系統的使用角度來說,數據的特征可分為靜态特征和動态特征:
1. 數據的靜态特征包括數據的基本結構、數據間的聯系和對數據取值範圍的約束。
2. 數據的動态特征是指對數據可以進行的操作以及操作規則,對數據庫數據的操作主要有查詢數據和更改數據,更改數據一般又包括對數據的插入、删除和更新。
數據的動态特征(數據操作)與數據的靜态特征(數據結構、完整性約束)統稱為數據模型三要素。
1.2.2 數據模型
模型是對事物、對象、過程等客觀系統中感興趣的内容的模拟和抽象表達,是理解系統的思維工具。數據模型(data model)也是一種模型,它是對現實世界數據特征的抽象。通俗地講,數據模型就是對現實世界數據的模拟。
數據模型一般應滿足三個要求:
1. 數據模型要能夠比較真實地模拟現實世界。
2. 數據模型要容易被人們理解。
3. 數據模型要能夠很方便地在計算機上實現。
數據模型實際上是模型化數據和信息的工具。根據模型應用目的的不同,可以将模型分為兩大類,它們分别屬于兩個不同的層次。
1. 概念層數據模型,也稱為概念數據模型或概念模型。
2. 組織層數據模型,也稱為組織模型,它從數據的組織方式來描述數據。
1.3 概念層數據模型概念層數據模型實際上是現實世界到機器世界的一個中間層次。
1.3.1 基本概念
概念層數據模型是指在抽象現實系統中有應用價值的元素及其關聯關系,反映現實系統中有應用價值的信息結構,并且不依賴于數據的組織層結構。
常用的概念層數據模型有實體—聯系(entity-relationship,E-R)模型、語義對象模型。
1.3.2 實體—聯系模型
E-R方法使用的工具稱為E-R圖,它所描述的現實世界的信息結構稱為企業模式(enterprise schema),也把這種描述結果稱為E-R模型。
1. 實體
實體是具有公共性質且可以相互區分的現實世界對象的集合。實體是具體的,如職工、學生、教師、課程。
2. 屬性
每個實體都具有一定的特征或性質,屬性就是描述實體或者聯系的性質或特征的數據項,一個實體中的所有實例都具有相同的性質,在E-R模型中,這些性質或特征就是屬性。
3. 聯系
實體内部的聯系通常是指一個實體内屬性之間的聯系,實體之間的聯系通常是指屬于不同實體的屬性之間的聯系。
兩個實體之間的聯系通常分為以下三類:
(1) 一對一聯系(1 : 1)。
(2) 一對多聯系(1 : n)。
(3) 多對多聯系(m : n)。
圖1-5 不同類型的聯系
實際上,一對一聯系是一對多聯系的特例,而一對多聯系又是多對多聯系的特例。
E-R模型不僅能描述兩個實體之間的聯系,而且還能描述兩個以上實體之間的聯系。
1.4 組織層數據模型組織層數據模型是從數據組織形式的角度來描述信息,目前,在數據庫技術的發展過程中用到的組織層數據模型主要有:層次模型(hierarchical model)、網狀模型(network model)、關系模型(relational model)、面向對象模型(object oriented model)和對象關系模型(object relational model)。
1.4.1 層次模型
層次模型用樹形結構表示實體和實體之間的聯系。現實世界中許多實體之間的聯系本身就呈現出一種自然的層次關系,如行政機構、家族關系等。
構成層次模型的樹由節點和連線組成,節點表示實體,節點中的項表示實體的屬性,連線表示相連的兩個實體間的聯系,這種是一對多的聯系。
1.4.2 網狀模型
在現實世界中事物之間更多的是非層次的聯系,用層次模型表達現實世界中存在的聯系有很多限制。如果去掉層次模型中的兩點限制,即允許一個以上的節點無父節點,并且每個節點可以有多個父節點,便構成了網狀模型。
用圖形結構表示實體和實體之間聯系的數據模型稱為網狀模型。
1.4.3 關系模型
關系模型是目前最重要的一種數據模型,關系數據庫就是采用關系模型作為數據的組織方式。關系模型源于數學,它把數據看作二維表中的元素,而這個二維表在關系數據庫中就稱為關系。用關系(表格數據)表示實體和實體之間的聯系的模型就稱為關系模型。
如表1-1和表1-2所示分别為“學生”關系模型的數據結構和“選課”關系模型的數據結構,其中“學生”和“選課”間的聯系是通過“學号”列實現的。
1.5 數據庫的三級模式結構
1.5.1 三級模式結構
數據庫系統内部的結構劃分為外模式、模式和内模式三個抽象結構,同時在三個模式之間提供二級映像功能。這些結構的劃分反映了看待數據庫的三個角度。圖1-11說明了這三種模式以及模式之間的映像關系。
圖1-11 數據庫系統的三級模式結構
廣義地講:
● 外模式:是最接近用戶的,也就是用戶所看到的數據視圖。
● 模式:是介于内模式和外模式之間的中間層次。
● 内模式:是最接近物理存儲的,也就是數據的物理存儲方式。
1.5.2 模式映像與數據獨立性
1. 外模式/模式映像
模式描述的是數據的全局邏輯結構,外模式描述的是數據的局部邏輯結構。
2. 模式/内模式映像
模式/内模式映像定義了數據庫的邏輯結構與物理存儲之間的對應關系,該映像關系通常被保存在數據庫的系統表(由數據庫管理系統自動創建和維護,用于存放維護系統正常運行的信息)中。
1.5.3 數據庫三級模式的關系
在數據庫的三級模式結構中,模式(邏輯模式)是數據庫的中心與關鍵,它獨立于數據庫的其他模式。設計數據庫時也是首先設計數據庫的邏輯模式。
數據庫的内模式依賴于數據庫的全局邏輯結構,但獨立于數據庫的用戶視圖,也就是外模式,也獨立于具體的存儲結構。内模式将全局邏輯結構中所定義的數據結構及其聯系按照一定的物理存儲策略進行組織,以達到較好的時間與空間效率。
數據庫的外模式面向具體的應用程序,它定義在邏輯模式之上,并獨立于存儲模式和存儲設備。當應用需求發生較大變化,相應的外模式不能滿足用戶要求時,就需要調整外模式定義,以滿足新的要求。
1.6 數據庫系統1.6.1 數據庫系統的組成
從狹義上講,數據庫系統主要指數據庫和數據庫管理系統。從廣義上講,數據庫系統由數據庫、數據庫管理系統(及其開發工具)、應用程序和用戶組成。其中,用戶可分為數據庫管理員、開發人員和最終用戶三類。數據庫系統結構如圖1-12所示。
圖1-12 數據庫系統結構
1.6.2 數據庫管理系統功能
數據庫管理系統是對數據庫進行管理的系統軟件,其主要作用是使數據庫成為方便用戶使用的資源,易于為各類用戶共享,并提供數據的安全性、完整性和可靠性保證。數據庫的所有操作,數據的組織、存儲和訪問都必須借助DBMS提供的工具或接口完成。
DBMS的功能概括起來如圖1-13所示。
圖1-13 DBMS的功能
(1)數據定義功能。
(2)數據操作功能。
(3)數據庫運行管理和控制功能
(4)數據庫的建立和維護功能。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!