tft每日頭條

 > 科技

 > 數據庫的髒數據指什麼

數據庫的髒數據指什麼

科技 更新时间:2025-01-19 18:49:38
概述

分享之前關于數據庫髒讀、不可重複讀、幻讀的相關筆記,也做個備忘!


如果沒有事務隔離,會出現什麼樣的情況?

假設我們現在有這樣一張表(T),裡面記錄了很多牛人的名字,我們不進行事務的隔離看看會發生什麼呢?

數據庫的髒數據指什麼(圖解數據庫髒讀)1

第一天,事務A訪問了數據庫,它幹了一件事情,往數據庫裡加上了新來的牛人的名字,但是沒有提交事務。

insert into T values (4, '牛D');

這時,來了另一個事務B,他要查詢所有牛人的名字。

select Name from T;

這時,如果沒有事務之間沒有有效隔離,那麼事務B返回的結果中就會出現“牛D”的名字。這就是“髒讀(dirty read)”。

第二天,事務A訪問了數據庫,他要查看ID是1的牛人的名字,于是執行了

select Name from T where ID = 1;

這時,事務B來了,因為ID是1的牛人改名字了,所以要更新一下,然後提交了事務。

update T set Name = '不牛' where ID = 1;

接着,事務A還想再看看ID是1的牛人的名字,于是又執行了

select Name from T where ID = 1;

結果,兩次讀出來的ID是1的牛人名字竟然不相同,這就是不可重複讀(unrepeatable read)

數據庫的髒數據指什麼(圖解數據庫髒讀)2

第三天,事務A訪問了數據庫,他想要看看數據庫的牛人都有哪些,于是執行了

select * from T;

這時候,事務B來了,往數據庫加入了一個新的牛人。

insert into T values(4, '牛D');

這時候,事務A忘了剛才的牛人都有哪些了,于是又執行了。

select * from T;

結果,第一次有三個牛人,第二次有四個牛人。

相信這個時候事務A就蒙了,剛才發生了什麼?這種情況就叫“幻讀(phantom problem)”。

數據庫的髒數據指什麼(圖解數據庫髒讀)3

為了防止出現髒讀、不可重複讀、幻讀等情況,我們就需要根據我們的實際需求來設置數據庫的隔離級别。下面介紹下這方面内容。


數據庫事務隔離級别

數據庫事務隔離級别分為四種(級别遞減):

1、Serializable (串行化):最嚴格的級别,事務串行執行,資源消耗最大;

2、REPEATABLE READ(重複讀) :保證了一個事務不會修改已經由另一個事務讀取但未提交(回滾)的數據。避免了“髒讀取”和“不可重複讀取”的情況,但不能避免“幻讀”,但是帶來了更多的性能損失。

3、READ COMMITTED (提交讀):大多數主流數據庫的默認事務等級,保證了一個事務不會讀到另一個并行事務已修改但未提交的數據,避免了“髒讀取”,但不能避免“幻讀”和“不可重複讀取”。該級别适用于大多數系統。

4、Read Uncommitted(未提交讀) :事務中的修改,即使沒有提交,其他事務也可以看得到,會導緻“髒讀”、“幻讀”和“不可重複讀取”。


髒讀、不可重複讀、幻讀:

一個數據庫可能擁有多個訪問客戶端,這些客戶端并發訪問數據庫時,若沒有采取必要的隔離措施,存在以下問題,這些問題分為5類,包括3類數據讀問題:髒讀、不可重複讀和幻讀。兩類數據更新問題:第一類丢失更新、第二類丢失更新。

1、髒讀

數據庫的髒數據指什麼(圖解數據庫髒讀)4

A事務讀取B事務尚未提交的更改數據,并在這個數據的基礎上進行操作,這時候如果事務B回滾,那麼A事務讀到的數據是不被承認的。例如常見的取款事務和轉賬事務:

2、不可重複讀

不可重複讀是指A事務讀取了B事務已經提交的更改數據。假如A在取款事務的過程中,B往該賬戶轉賬100,A兩次讀取的餘額發生不一緻。

3、幻讀

數據庫的髒數據指什麼(圖解數據庫髒讀)5

A事務讀取B事務提交的新增數據,會引發幻讀問題。幻讀一般發生在計算統計數據的事務中,例如銀行系統在同一個事務中兩次統計存款賬戶的總金額,在兩次統計中,剛好新增了一個存款賬戶,存入了100,這時候兩次統計的總金額不一緻。

注意:不可重複讀和幻讀的區别是:前者是指讀到了已經提交的事務的更改數據(修改或删除),後者是指讀到了其他已經提交事務的新增數據。對于這兩種問題解決采用不同的辦法,防止讀到更改數據,隻需對操作的數據添加行級鎖,防止操作中的數據發生變化;二防止讀到新增數據,往往需要添加表級鎖,将整張表鎖定,防止新增數據(oracle采用多版本數據的方式實現)。

4、通俗解釋:

髒讀:所謂的髒讀,其實就是讀到了别的事務回滾前的髒數據。比如事務B執行過程中修改了數據X,在未提交前,事務A讀取了X,而事務B卻回滾了,這樣事務A就形成了髒讀。

也就是說,當前事務讀到的數據是别的事務想要修改成為的但是沒有修改成功的數據。

不可重複讀:事務A首先讀取了一條數據,然後執行邏輯的時候,事務B将這條數據改變了,然後事務A再次讀取的時候,發現數據不匹配了,就是所謂的不可重複讀了。

也就是說,當前事務先進行了一次數據讀取,然後再次讀取到的數據是别的事務修改成功的數據,導緻兩次讀取到的數據不匹配,也就照應了不可重複讀的語義。

幻讀:事務A首先根據條件索引得到N條數據,然後事務B改變了這N條數據之外的M條或者增添了M條符合事務A搜索條件的數據,導緻事務A再次搜索發現有N M條數據了,就産生了幻讀。

也就是說,當前事務讀第一次取到的數據比後來讀取到數據條目少。

不可重複讀和幻讀比較:

兩者有些相似,但是前者針對的是update或delete,後者針對的insert。


數據庫的髒數據指什麼(圖解數據庫髒讀)6

為什麼會出現“髒讀”?因為沒有“select”操作沒有規矩。

為什麼會出現“不可重複讀”?因為“update”操作沒有規矩。

為什麼會出現“幻讀”?因為“insert”和“delete”操作沒有規矩。

“讀未提(Read Uncommitted)”能預防啥?啥都預防不了。

“讀提交(Read Committed)”能預防啥?使用“快照讀(Snapshot Read)”,避免“髒讀”,但是可能出現“不可重複讀”和“幻讀”。

“可重複讀(Repeated Red)”能預防啥?使用“快照讀(Snapshot Read)”,鎖住被讀取記錄,避免出現“髒讀”、“不可重複讀”,但是可能出現“幻讀”。

“串行化(Serializable)”能預防啥?排排坐,吃果果,有效避免“髒讀”、“不可重複讀”、“幻讀”,不過效果誰用誰知道。

後面會分享更多DBA方面内容,感興趣的朋友可以關注下!

數據庫的髒數據指什麼(圖解數據庫髒讀)7

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved