用sql還是pandas處理數據-tft每日頭條

用sql還是pandas處理數據

科技更新时间:2026-07-22 16:40:38

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）1

SQL 和 pandas 是兩種不同的工具，但它們都在處理數據時扮演着重要角色。SQL 和 Pandas 不僅是處理任何與數據相關工作的基本工具，而且即使是新手用戶也非常易于使用和實現。SQL 在數據庫環境中工作，因此也需要了解數據庫，而 Pandas 可以在電腦或基于浏覽器的編輯器等簡單的環境中快速使用，從簡單的 CSV 文件開始。在本文中，我将分享一系列可以對數據執行的操作列表，并比較如何使用 SQL 和 Pandas 完成相同的任務。

關于 SQL 和 Pandas

讓我們簡單了解一下 SQL 和 Pandas。

SQL： 一種編程語言，更确切地說，它是一種可用于執行數據庫操作的查詢語言。可用于存儲、查詢、更新和修改數據。SQL 是大多數 RDBMS 實際使用的語言。

Pandas：實際上 Pandas 是 Python 語言的一個庫，它可以幫助我們進行許多使用數據的操作。Pandas 使用的數據類型主要是表格。它也可以用于數據倉庫，使用 Pandas 我們可以在移入或移出數據時檢查數據。

通過上述幾點可知，Pandas 是 Python 中的一個庫或工具包，而 SQL 本身就是一種查詢語言。

在什麼情況下使用 SQL 和 Pandas ？

SQL 和 Pandas 可以在各種應用程序中使用。讓我們來看看它們的主要用法。

SQL：我們可以把 SQL 作為數據處理的首選，我們可以使用它來管理幾種類型的關系數據庫，查詢數據倉庫或分布式數據庫。雖然我們也可以使用SQL進行數據分析，而且它是一種高性能語言，具有高維數據。

Pandas：我們可以把 Pandas 看作是數據的最後一個存放點，以便我們轉換數據。對于複雜的數據轉換和 EDA，Pandas 是一個更好的地方。大多時候，我們使用 Pandas 來處理數據幀格式的數據，這是一種整潔的數據形式。

通過上述幾點，我們可以說，在數據分析的過程中我們可以使用 SQL 分析數據并從中導入所需的功能，然後使用 Pandas 更深入地分析數據并對其進行處理以進行機器學習建模。

說到業務邏輯，使用 SQL 的一個基本優勢是我們可以将數據分發給每個人。SQL 可以在各種情況下提供幫助，例如将數據導入 Python、在 Tableau 中構建儀表闆、顯示 Web 報告等，并确保流程的性能更高。使用 Pandas 進行數據操作的優點包括我們可以将數據存儲到一台計算機中，與重複查詢數據庫相比，I / O成本和延遲更低，并且能夠在每個數據段中應用任意功能。

數據操作的比較

許多數據分析從業者必須定期使用 SQL 和 Pandas 來完成各種與數據相關的任務。因此，本文的這一部分将了解如何使用 SQL 語言和 Pandas 庫執行不同的操作。為了解釋這個過程，我們将使用泰坦尼克号數據集。

import Pandas as pd path = 'https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/stuff/' data = pd.read_csv(path "titanic.csv") data.head()

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）2

從輸出中我們可以看到不同列的名稱。現在開始我們的第一個操作。

● select

該操作用于從給定數據中獲取所需的信息。使用SQL語言，我們可以通過以下方式使用一些變量執行這一操作：

SELECT Survived, Pclass, Name FROM data LIMIT 5;

說到 Pandas 庫，我們可以通過以下方式來選擇變量：

data[['Survived', 'Pclass', 'Name']].head()

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）3

● where

這是一個條件操作，我們主要使用它來從符合某些條件的數據中查找數據值。使用SQL，我們可以通過以下方式找到性别變量為男性的數據點：

SELECT * FROM data WHERE Sex = 'male' LIMIT 5

可以通過以下方式使用 pandas 執行相同的操作：

data[data['Sex'] == 'male'].head()

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）4

請注意，我們在 SQL 中使用 * （星号）來顯示數據中的所有列。

● OR 和 AND

這是将兩個條件合并為一個條件的條件操作。使用 SQL 語言，我們可以通過以下方式找到變量性别為男性且年齡大于5歲的值：

SELECT * FROM data WHERE Sex = 'Male' AND Age > 5.00;

我們可以通過以下方式使用 Pandas 來執行相同的操作：

data[(data['Sex'] == 'male') & (data['Age'] > 5.00)]

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）5

● Group by

使用某些類别對數據值進行分組。有了這些數據，我們可以将男性和女性分組。在SQL中，可以通過以下方式實現：

SELECT Sex, count(*) FROM data GROUP BY Sex;

注意：此查詢将提供每個性别的記錄數。

可通過以下方式使用 pandas 執行相同的程序：

data.groupby('Sex').size()

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）6

● Join

連接操作是使用 SQL 最常用的操作，因為它主要幫助使用兩個或多個數據生成新數據。可以通過以下幾種方式連接數據：

• Inner join

此連接提供了加入的變量的公共值，使用 SQL 通過以下方式執行此操作：

SELECT * FROM df1 INNER JOIN df2 ON df1.key = df2.key;

這裡有兩個數據幀（df1 和 df2）和一個公共變量（key）。要執行此操作，我們需要有兩個或多個數據集。可以通過以下方式使用 Pandas 制作數據幀：

import numpy as np df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': np.random.randn(4)}) df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'], 'value': np.random.randn(4)})

現在，我們可以通過以下方式對數據集進行内連接：

pd.merge（df1， df2， on='key'）

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）7

• Left outer join

此操作有助于我們使用子句連接數據集。借助此功能，我們可以保留左側數據中不匹配的行，并以右表的形式将它們與空行連接起來。在SQL中，可以通過以下方式執行此操作：

SELECT * FROM df1 LEFT OUTER JOIN df2 ON df1.key = df2.key;

可以通過以下方式使用 pandas 執行相同的操作：

pd.merge(df1, df2, on='key', how='left')

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）8

• Right outer join

我們使用該子句保留右側數據中的行，并在第一個（左）表的形狀中使用 null 連接它們。我們可以通過以下方式使用 SQL 執行此操作：

SELECT * FROM df1 RIGHT OUTER JOIN df2 ON df1.key = df2.key;

通過以下方式使用 pandas 執行相同操作：

pd.merge(df1, df2, on='key', how='right')

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）9

• Full join

此操作在連接數據時保留每個數據的所有行。此操作可以通過以下方式使用 SQL 執行：

SELECT * FROM df1 FULL OUTER JOIN df2 ON df1.key = df2.key;

可以使用 pandas 通過以下方式執行相同的操作：

pd.merge(df1, df2, on='key', how='outer')

輸出：

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）10

在上面的内容中，我們看到了一些可以使用 Pandas 庫和 SQL 語言執行的重要操作。可以說将 Pandas 轉換為 SQL 或将 Pandas 轉換為 SQL 并不是一項艱巨的任務。我們可以配合着使用它們，用 SQL 來處理數據庫中的數據，用 Pandas 來處理維數較低的數據。數據分析優質社群，等你加入哦~

用sql還是pandas處理數據（九道門如何使用Pandas對數據執行SQL查詢）11

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技顯卡自動降頻解決方法
1、更換下顯卡驅動，建議到顯卡品牌官網下載最新版本的安裝使用，驅動和遊戲程序不匹配或者驅動已經被損壞... 2023-07-06
科技減脂稱怎麼連接手機
具體步驟如下：1、安裝下載相關智能體脂秤app，打開智能體脂秤。2、選擇體脂秤-選擇體脂秤型号，進行... 2023-07-06
科技蘋果手機錄音在哪裡
1、首先我們先打開手機，找到這個附加功能。然後點擊這個語音備忘錄。點擊這個紅色的開始錄音。錄音時，可... 2023-07-06
科技飼料顆粒機怎麼配料
1、原先使用哪些原料配比，如今仍可以使用，但要考慮精料與粗料的配比其實在很多養殖戶拿到飼料顆粒機時，... 2023-07-06
科技如何将抖音動态視屏删除
1、删除抖音中的動态視頻需要在個人中心删除，打開抖音進入推薦播放界面後點擊右下角的【我】選項。2、點... 2023-07-06
科技 word框裡怎麼打√
1、以華為MateBookX，MicrosoftOffice2020，Win10為例。按住鍵盤上的ALT鍵不放，然後在小鍵盤區輸入“9745”，最後松開ALT鍵，自動變成框框中帶勾符号。MicrosoftOfficeWord是微軟公司的一個文字處理器應用程序。最初由RichardBrodie為了運行DOS的IBM計算機而在1983年編寫。随後的版本可運行于AppleMaci 2023-07-06
科技挖機上坡有什麼技巧
1、首先，系好安全帶。其次，自己要有信心有把握能上去，一般來說隻要是小于70度的坡并且地面比較夯實，基本都能上去，但也要看具體實際的情況。觀察坡的角度是否在挖掘機可行進的範圍内，如果坡度太高，可以把坡上半部的料抖到下半部，減小坡的角度。2、上坡的時候要和坡面對齊，不然容易失去重心，并且在上坡行進的時候更要時刻注意重心。注意石塊，小心清除，在爬較陡的坡時，不起眼的小石頭塊也有可能導緻挖掘機履帶打滑無 2023-07-06
科技打印機打印出來是白紙是怎麼回事
1、墨盒裡有墨而打印出來是白紙，可能打印頭被塞住了，可以測試打印頭：2、打開一個文檔（如打開Word... 2023-07-06
科技五号七号電池哪個大
1、五号或七号電池外包裝上都有标示的，5号的比七号的要大一點。2、AA就是我們通常所說的5号電池；A... 2023-07-06
科技 win10鼠标延遲怎麼解決
1、有線無線通用：（1）在win10系統桌面，按下【WIN】+【R】快捷鍵，打開【運行】窗口，輸入m... 2023-07-06
科技如何裝win7系統
1、将win7系統iso壓縮包文件下載到C盤之外的分區，比如下載到F盤，右鍵使用WinRAR等工具解... 2023-07-06
科技電腦卡死不動了怎麼辦
1、啟動任務管理器：按【ctrl+alt+del】組合鍵快速啟動任務管理器。（注：死機電腦無反應時往... 2023-07-06
科技 python和java究竟哪個更值得...
1、就目前這種情況來說，Python發展前途更好一點，不過雖然java沒有之前發展那麼火爆了，但是java的應用數量還是最高的，在市場上已經擁有了非常穩固的地位。而Python的話跟之前的java是比較相似的，正在快速的發展，也獨具自己的優勢。2、一般情況的話，想要轉行IT行業，沒有基礎的人，建議學習Python比較好，Python相對于Java來說更加簡單一些，上手容易、功能強大，開發效率高，适 2023-07-06
科技電腦上怎樣給文件蓋章
1、通過軟件的“選項”菜單選擇圖章的基本形狀。如本例我們選擇制作“橢圓章”（此外還支持圓章、方章、菱... 2023-07-06
科技 25t吊車油耗
1、住工地的油耗25t8小時一台班不加油門,200-250塊左右一天.50t的250-300塊左右.... 2023-07-06
科技蘋果手機怎麼開雙屏模式
演示機型：Iphone12系統版本：ios14一、首先在手機桌面點擊“設置”。二、然後在設置界面選擇“通用”選項。三、接着打開“輔助功能”進入。四、進入以後将“編輯訪問”的開關開啟。五、最後連續按home鍵兩次即可調出雙屏模式。 2023-07-06
科技 dn是什麼軟件
以華為MateBookX，win10系統，Dimension2020版本為例：DN是（Dimension）軟件的簡稱，是adobe公司新推出的一款3D設計軟件，AdobeDimension能與AdobePhotoshop以及Illustrator等軟件緊密結合起來，而且模型、燈光、材質、渲染的操作都是非常容易上手。Dimension軟件，不同于其他3D設計軟件，如C4D、Maya等，Dimensi 2023-07-06
科技計算機的工作原理
1、計算機在運行時，先從内存中取出第一條指令，通過控制器的譯碼，按指令的要求，從存儲器中取出數據進行... 2023-07-06
科技 list和set的區别
1、List是可重複集合，Set是不可重複集合，這兩個接口都實現了Collection父接口。Lis... 2023-07-06
科技怎麼在網上交電費
1、我們可以打開手機，找到微信軟件，找到右下角到“我”，看到有個“支付”。2、點擊“支付”按鈕，然後... 2023-07-06
科技路由器輻射對人體有害嗎
1、無線路由器一直開着對人體沒有危害。2、任何用電設備都會有電磁輻射，因此，無線路由器肯定會有輻射。... 2023-07-06
科技鏟車人什麼梗
鏟車人的梗來自于鬥魚一個爐石傳說主播，其昵稱叫異靈術，因為經常在直播間内被水友調侃鏟子嘴，鏟子就是這... 2023-07-06
科技 vivo手機怎麼保存視頻
1、首先用手機浏覽器打開要保存的視頻。2、之後将視頻進行全屏播放。3、最後點擊右下角的下載按鈕，下載完即可保存到手機裡。 2023-07-06
科技華為語音助手設置
1、打開手機，然後用手指按住手機的實體鍵。當在屏幕上看到帶有麥克風徽标的圓圈時，請單擊它，這樣就可以... 2023-07-06
科技硬盤安裝教程
1、首先，需要準備好三樣東西，并且缺一不可，第一就是硬盤，第二是SATA線，注意買硬盤的時候問清楚，... 2023-07-06
科技蘋果手機qq音樂桌面歌詞怎麼設置
1、蘋果手機qq音樂桌面歌詞設置方法：打開【設置】，點擊【通知】，打開【QQ音樂】的【允許通知】，進... 2023-07-06
科技 oppor17為什麼充電充不起
1、若oppor17充電充不進，首先檢查一下原裝充電器是否正常。2、檢查一下充電器那一整根的原裝充電數據線内部是否存在接觸不良現象。3、再檢查一下充電數據線插頭與手機充電尾插兩者之間内部是否也存在着接觸不良等問題。4、檢查一下手機内部的池是否正常。 2023-07-06
科技電腦關機卡白屏如何處理
1、散熱不良，顯示器、電源和CPU工作時間太長會導緻死機，給風扇除塵，上油，或更換風扇，台式機在主機... 2023-07-06
科技電子腳鐐為什麼取不了
1、具有GPS追蹤功能，每随2秒就會更新GPS資料，而GPS位置的準确度介于1.8m至15m。2、有... 2023-07-06
科技淘寶退款退回新享禮金什麼意思
演示機型：Iphone12系統版本：iOS14APP版本：淘寶9.25.0當退款某樣商品後，新享禮金等優惠券也會一并退回，下次可繼續使用。淘寶網是亞太地區較大的網絡零售、商圈，由阿裡巴巴集團在2003年5月創立。淘寶網是中國深受歡迎的網購零售平台，擁有近5億的注冊用戶數，每天有超過6000萬的固定訪客。淘寶網提倡誠信、活躍、快速的網絡交易文化，堅持寶可不淘，信不能棄。在為淘寶會員打造更安全高效的網 2023-07-06

tft每日頭條

> 科技

> 用sql還是pandas處理數據

用sql還是pandas處理數據

相关科技资讯推荐

热门科技资讯推荐

网友关注