pandas 多維數據分析-tft每日頭條

pandas 多維數據分析

科技更新时间:2026-07-16 22:38:05

pandas是數據分析師最常用的工具之一，掌握以下函數足以應對工作中的各種需求，

pandas 多維數據分析（使用pandas做數據分析）1

P4 數據集描述
P5 重命名列名稱
P6 删除列
P7 整體排序
P8 通過列條件篩選數據
P9 多條件篩選
P11 怎樣使用axis參數
P12 字符串方法
P13 改變數據類型
P14 什麼時候使用groupby
P15 探索series
P16 處理缺失值
P17 關于index
P18 選擇多行或多列
P21 減少dataframe占用内存
P24 創建虛拟變量(one-hot編碼)
P25 時間字段處理
P26 去除重複項
P27 怎樣避免SettingWithCopyWarming
P28 改變顯示選項
P29 創建Dateframe的方式
P30 對DataFrame或Series使用函數

P4 數據集描述

df.describe() df.describe(include=['object']) df.shape df.dtypes

P5 重命名列名稱

df.columns df.rename(columns={'name1':'rename1', 'name2':'rename2'}, inplace=True) df_newcolumns = ['rename1', 'rename2'] df.columns = df_newcolumns # 替換列名中的字符 df.columns = df.columns.str.replace(' ', '_')

P6 删除列

df.drop('name1', axis=1, inplace=True) # axis=1 列 df.drop(['name1','name2'], axis=1, inplace=True)

P7 整體排序

df['name1'].sort_values(ascending=False) # ascending=False 倒序 df.sort_values('name', ascending=False) df.sort_values(['name1','name2'], ascending=False)

P8 通過列條件篩選數據

df[df.age>20] df.loc[df.age>20, 'name1']

P9 多條件篩選

df[(df.name1>10) & (df.name2<0)] df[(df.name1>10) | (df.name2<0)] df[df.name1.isin(['key1', 'key2', 'key3'])]

P11 怎樣使用axis參數

df.drop('name',axis=1) df.mean(axis=0) # 每列的均值 df.mean(axis=1) # 每行的均值

pandas 多維數據分析（使用pandas做數據分析）2

P12 字符串方法

# name1列轉大寫 df.name1.str.upper() df.name1.str.contain('hah') # 返回True/False df[df.name1.str.contain('hah')] # 用于篩選

P13 改變數據類型

df.name = df.name.astype(float) df = pd.read_csv(dtype={'name1':float}) # 布爾型裝換位0、1 df.name1.astype(int)

P14 什麼時候使用groupby

df.groupby('name1').name2.mean() df.groupby('name1').name2.agg(['count','mean', 'max', 'min']) df.groupby('name1').mean() # 得到所有列的均值對每列使用不同的聚合函數怎麼做

pandas 多維數據分析（使用pandas做數據分析）3

P15 探索series

# 一列中每個元素的數量 df.name.value_counts() # 默認不計算缺失值，如果要計算需要（dropna=False） # 一列中每個元素的占比 df.name.value_counts(normalize=True) # 一列中每個元素 df.name.unique() # 一列中元素數量 df.name.nunique() pd.crosstab(df.name1, df.name2) # 價差表

P16 處理缺失值

# 查看是否是缺失值 df.isnull()/df.notnull() # 查看每個特征缺失值數量 df.isnull().sum() df.dropna(how='any') # 删除所有包含缺失值的行 df.dropna(how='all') # 删除所有值都是缺失值的行 df.dropna(subset=['name1', 'name2'], how='any') # 删除這兩列中包含缺失值的行 # 填充缺失值 df['name'] = df['name'].fillna(value='hah', inplace=True)

P17 關于index

# 重置index df.set_index('name1', inplace=True) df.reset_index(inplace=True) # 改變index的name df.index.name = None df.index.name = 'hdah' pd.concat([df1, series1], axis=1) # 可以合并dataframe和series

P18 選擇多行或多列

df.loc # 使用标簽名稱 df.loc[1:3,:] # 包含1和3 df.iloc # 使用位置 df.iloc[1:3,:] # 包含1不包含3

P21 減少dataframe占用内存

pandas 多維數據分析（使用pandas做數據分析）4

# 查看個字段占用内存 df.memory_usage(deep=True) # 為object加上自定義大小順序 df['name'] = df['name'].astype('category', categories=['good', 'good1', 'good2'], ordered=True)

P24 創建虛拟變量(one-hot編碼)

df['new_name'] = df.name.map({'x':1, 'y':2}) # 把name列中的x改為1，y改為2 pandas.get_dummies(df.sex, prefix='sex') # 離散特征重新編碼,以x開頭 pandas.get_dummies(df, columns=['name1', 'name2'], drop_first=True) # drop_first參數默認為False,删除結果中的第一列。

P25 時間字段處理

# 字符串切片 df.name1.str.slice(-5,-3) # 日期處理函數 df['time'] = pd.to_datetime(df.time) # 其他方法（.dt.） df.time.dt.weekday or weekday_name 返回周幾 df.time.dt.dayofyear 返回一年中的第幾天 # 作為篩選條件 ts = pd.to_datetime('1/1/2019') df.loc[df.times>ts, :] # 日期之間的數學計算 (df.times.max() - df.times.min()).days

P26 去除重複項

# 重複個數 df.name.dumplicated().sum() df.dumplicated().sum() # 重複項明細 df.loc[df.dumplicated(keep=False), :] keep參數，False全部顯示，first顯示做後一個，last顯示第一個； # 删除重複想 df.drop_dumplicates(keep=last) df.drop_dumplicates(subset=['name1', 'name2'])

pandas 多維數據分析（使用pandas做數據分析）5

P27 怎樣避免SettingWithCopyWarming

盡量使用loc，避免直接copy 經過多級篩選之後，pandas不确定當前Dateframe是否是copy過來的，所以，對當前dateframe操作時，不确定是否為影響最初的數據集，而爆出SettingWithCopyWarming，可以在最初拷貝數據集的時候使用copy方法；

P28 改變顯示選項

主要方法 pandas.get_option() 顯示所有行 pd.set_option('display.max_rows', None) 默認顯示60行 pd.set_option('display.max_rows', None) 其他選項最大列數：display.max_columns 最大單元格寬度：display.max_colwidth 小數點位數：display.precision 查看目前選項： pd.describe_option() pd.describe_option('rows') 重置所有默認選項 pd.reset_option('all')

P29 創建Dateframe的方式

1 字典 pd.DataFrame({'id':[1,2,3], 'name':['hah','jjj','kk']}, columns=['id2', 'name2'], index=['x','y','z']) 2 列表 pd.DataFrame([[1,2,3], ['x','v','b'], [1,'5','x']]) 一個子列表為一行 3 使用numpy arr = np.random.rand(4,2) 4行2列 pd.DataFrame(arr) 4 字典結合numpy pd.DataFrame({'id':np.arrange(100,110,1), 'name':np.random.randint(60, 101,10)}) 5 連接DataFrame和Series' pd.concat([df,s], axis=1)

P30 對DataFrame或Series使用函數

map df['name1'] = df.name.map({'x':1, 'y':2}) apply df[name1] = df.name,apply(len) df[name1] = df.name,apply(np.ciel) def fun(x,y): return x[y] df.name.apply(fun, y=2 df.apply(max, axis=0) 每一列的最大值 df.apply(max, axis=1) 每一行的最大值 df.apply(np.argmax, axis=1) 每一行的最大值對應的列名 applymap 針對全局每一個單元格做操作 df.applymap(float)

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技有免費版的wps嗎手機版
之前我用ios系統，一直割舍不掉的，就是掃描寶，印象筆記出的周邊掃描軟件。不得不說，自己出門出差在外，外面掃描的費用，可比打印貴的多喽。因為清晰度，因為設備的購置問題吧，我是覺得這純屬忽悠。連材料都不消耗的~~~後來用了蘋果，有了掃描寶，少... 2022-11-13
科技手機顔色反轉了怎麼設置
手機顔色反轉了怎麼設置?首先，在手機桌面上找到設置圖标，點擊進入，我來為大家講解一下關于手機顔色反轉了怎麼設置?跟着小編一起來看一看吧!手機顔色反轉了怎麼設置首先，在手機桌面上找到設置圖标，點擊進入。接着在設置頁面中找到“更多設置”一項，點... 2022-06-17
科技粉色和紫色的個性文字手機壁紙
精美壁紙頭像每日推送喜歡的記得扣111，不要忘了點贊收藏關注, 2022-12-04
科技電話外呼系統是什麼意思
電話外呼系統是什麼意思?電話外呼系統是指通過電腦自動往外撥打用戶電話，将錄制好的語音通過電腦播放給用戶它是基于CTI技術的現代客戶服務中心系統不可或缺的一個組成部分外呼分為兩個階段：外呼數據的獲取以及外呼動作的發起，接下來我們就來聊聊關于電... 2022-06-30
科技技嘉b660小雕主闆
去年10月28日，英特爾的第12代酷睿處理器正式上市，首發了6款桌面處理器型号，包括：i9-12900K、i9-12900KF、i7-12700K、i7-12700KF、i5-12600K和12600KF。12代酷睿處理器的性能較11代，有... 2022-11-16
科技商場打造空姐式服務
鄒先生去年裝修房子前，在短視頻平台刷到一個裝修賬号，委托對方做了全屋家裝，花了三十多萬。今年五月份入住，目前還有些問題，沒有解決。視頻：看短視頻選裝修方交錢三十多萬，結果幾家一起做的？鄒先生的房子位于甯波清秀瀾灣小區，2020年交付的，去年... 2022-11-17
科技白雲區智能取餐櫃品牌
廣東偉仕達電器科技有限公司始創于1993年，是專業研發、生産、銷售電烤箱、多士爐等家用電器的知名企業，産品暢銷全球五十多個國家和地區。旗下"Changdi長帝”品牌連續多年電烤箱行業全網銷量領先。多年來長帝緻力于打造“好用不貴”的西... 2022-11-18
科技手機版本升級後要輸入plN碼怎麼回事
手機版本升級後要輸入plN碼怎麼回事?手機版本升級後要輸入PIN碼是因為這個密碼很重要，即便是别人拾獲你的手機，換sim卡，隻有輸入正确的pin碼，手機才能使用，接下來我們就來聊聊關于手機版本升級後要輸入plN碼怎麼回事?以下内容大家不妨參... 2022-06-18
科技交通運輸先進表彰
半島記者馬正拓半島記者1月7日從省交通運輸廳獲悉，根據省人力資源社會保障廳、省交通運輸廳有關文件要求，經各市人力資源社會保障局、交通運輸局逐級審核推薦和評選，并經山東省交通運輸系統先進集體和先進個人評選表彰工作領導小組審核，拟表彰山東省交通... 2022-11-18
科技别克新能源汽車怎麼用手機控制
車東西|莫拉時光如斯，轉眼間已經來到2019年，一衆車企紛紛為旗下車型推出了2019款新品，别克也是其中之一，2019款的GL6、英朗、君威、昂科威等車型已經先後上市。新款别克車型在對外觀内飾進行微調的同時，還着重升級了其eConnect車... 2022-10-25
科技最新創意立體科幻繪畫
圖片來自網絡，僅做分享如有侵權請聯系删除哦！, 2022-11-25
科技怎麼才能讓蘋果手機快速充電
怎麼才能讓蘋果手機快速充電?關機充電非常快iPhone關機之後充電速度非常快關機之後iPhone就不會再消耗電量了，隻進不出自然充電速度會很快不過這個方法隻适合那些暫時不需要接受電話和信息的用戶，我來為大家科普一下關于怎麼才能讓蘋果手機快速... 2022-06-11
科技監控安裝視頻步驟
監控安裝視頻步驟?确定攝像機的安裝位置和監控區域，将攝像機通過攝像機支架固定到建築物或監控立杆上；确定後台設備（硬盤錄像機和顯示器）的擺放位置，硬盤錄像機安裝好後需要為後台設備提供電源插排；，我來為大家科普一下關于監控安裝視頻步驟?下面希望... 2022-08-17
科技電腦在使用時突然藍屏是怎麼回事
電腦藍屏、電腦黑屏、電腦死機、加載程序無響應、電腦卡頓等都是我們常見的電腦故障現象，這些故障現象有的是硬件引起的，有的是軟件問題引起的，無論是哪一種問題引起的故障，都會對我們的正常使用産生影響，今天小編就遇到了一位客戶，電腦老是會藍屏，正玩... 2023-01-03
科技華為手機的質量到底怎麼樣
我一直對華為印象非常好！尤其是華為所推崇的颠覆式創新模式，得以讓華為在落後的情況下，技術取得領先。昨天，我去當地一家華為經銷商處買手機。作為一個備用機，隻是作為直播的時候放伴奏，因為電腦不是很方便。本文作者|《華爾街思維》主編郭熠然我還有一... 2023-02-05
科技手機qq的兩個小功能
近日，手機QQ更新了V8.2.6.700版本，蘋果iOS版和安卓版手機QQ上線了一個新功能：可以實時顯示對方的手機電量以及充電狀态。開通電量顯示也很簡單，長按主頁左上方的頭像，在在線狀态中選擇我的電量即可。從圖中我們可以看到，QQ顯示模式從... 2022-10-28
科技海爾掃地機器人t525s評測
人們對于智能生活越來越渴望，市面上的智能機器人種類也多，以掃地機器人為例，有拖濕一體機，也有規劃式機器，全自動、遠程操控等等，智能屬性疊加多，選擇上其實越來越難，尤其是再給老人選購時，這些智能他們能都玩的轉，這是個問題!今天評測一款海爾極光... 2022-11-19
科技電腦彈窗廣告太多怎麼辦
電腦彈窗廣告太多怎麼辦?準備工具電腦、電腦管家首先下載好電腦管家，最好是最新版的，打開電腦管家，接下來我們就來聊聊關于電腦彈窗廣告太多怎麼辦?以下内容大家不妨參考一二希望能幫到您!電腦彈窗廣告太多怎麼辦準備工具。電腦、電腦管家。首先下載好電... 2022-06-24
科技 c盤有瑕疵怎麼把d盤設置成系統盤
DG分區工具的妙②系統遷移文章内容來源于：DiskGenius官網有時我們會遇到一些困難，比如電腦使用越來越卡，使用的時間增加電腦的負荷越大，在不知不覺中電腦的C盤就占用已經變成了紅色，有時候很困惑明明沒有安裝多少軟件到C盤，但是就是會慢慢... 2022-11-15
科技 oppo手機是什麼時候出來的
oppo手機是什麼時候出來的?OPPO于2008年推出第一款“笑臉手機”，由此開啟探索和引領至美科技之旅今天，OPPO憑借以Find和R系列手機為核心的智能終端産品，以及OPPO+等互聯網服務，讓全球消費者盡享至美科技，今天小編就來聊一聊關... 2022-06-17
科技計算機科學适合什麼樣的人學
人文素養的困局美國《大西洋月刊》報道說，一項針對大學新生進行的一年一度的長期調查發現，在過去10年裡，學生們說自己上大學的首要原因就是為了找一份更好的工作；而在2008年大衰退前的20年裡，上大學的首要原因是：學習自己感興趣的東西。學生的這... 2022-11-12
科技現役nba球員身高排名
“你不能教隊員怎麼長高。”——前NBA波士頓凱爾特人隊主教練紅衣主教（RedAuerbach）裡德·奧爾巴赫主要發現：NBA現役球員的平均身高為6英尺6.3英寸（202cm），在過去的39個賽季中從未如此矮小。現役球員中控球後衛是NBA曆史... 2022-11-22
科技電腦安裝打印機驅動怎麼安裝步驟
電腦安裝打印機驅動怎麼安裝步驟?打開控制面闆，點擊“設備和打印機”，今天小編就來說說關于電腦安裝打印機驅動怎麼安裝步驟?下面更多詳細答案一起來看看吧!電腦安裝打印機驅動怎麼安裝步驟打開控制面闆，點擊“設備和打印機”點擊“打印服務器屬性”在“... 2022-06-29
科技電腦升級系統後怎樣還原
電腦升級系統後怎樣還原?鼠标右鍵右擊“我的電腦”選擇“屬性”按鈕，下面我們就來說一說關于電腦升級系統後怎樣還原?我們一起去了解并探讨一下這個問題吧!電腦升級系統後怎樣還原鼠标右鍵右擊“我的電腦”。選擇“屬性”按鈕。然後在系統屬性的對話框中點... 2022-07-13
科技科技部高新科技司火炬計劃
科技部高新科技司火炬計劃?河南日報社全媒體記者王冰珂通訊員郭祺，今天小編就來聊一聊關于科技部高新科技司火炬計劃?接下來我們就一起去研究一下吧!科技部高新科技司火炬計劃河南日報社全媒體記者王冰珂通訊員郭祺近日，平頂山高新區管委會收到一封感謝信... 2022-10-25
科技汽車空調壓縮機原理
汽車空調壓縮機原理?汽車空調壓縮機是汽車空調制冷系統的心髒，起着壓縮和輸送制冷劑蒸汽的作用壓縮機分為不可變排量和可變排量兩種根據工作原理的不同，空調壓縮機可以分為定排量壓縮機和變排量壓縮機，現在小編就來說說關于汽車空調壓縮機原理?下面内容希... 2022-06-13
科技超早期發現乳腺癌
超早期發現乳腺癌?新華社倫敦１２月２２日電（記者張家偉）癌症早期診斷對治療非常重要英國倫敦大學學院２２日發表一項成果說，該校研究人員發現一種新的乳腺癌标記物，據此能夠比現有方法提前１年診斷出這類腫瘤，下面我們就來說一說關于超早期發現乳腺癌?... 2022-10-26
科技 wifi能連接但不能上網
wifi能連接但不能上網?首先，要知道，WiFi連接成功并不意味着能夠成功上網要保證路由器能夠正常提供上網的網絡，并且确定你的設備沒有被路由器設置Mac地址過濾要是被Mac地址過濾了，就要記得把設備mac地址添加進去，保存即可使用，我來為大... 2022-06-09
科技蘋果手機美版是不是翻新機
作為一個有良心的手機販子，從事手機行業11年，我非常有必要向大家普及一下蘋果手機到底有哪幾種貨源，讓更多人明白怎麼挑選手機是我的責任和使命。先以蘋果手機為例。一，最先跟大家說就是大家在店裡、各個電商平台看到的手機，就是所謂的有發票的原封機，... 2022-12-05
科技 win10版本區别和推薦
Win10系統現已超過win7，成為最大的操作系統。它安全性高，兼容性強，深受大家的喜愛。那麼win10系統有這麼多版本，這些版本之間有什麼區别呢？哪個版本更好？接下來，我将介紹win10版本的不同之處win10版本有什麼區别？随着win1... 2022-11-06

tft每日頭條

> 科技

> pandas 多維數據分析

pandas 多維數據分析

相关科技资讯推荐

热门科技资讯推荐

网友关注