tft每日頭條

 > 科技

 > pandas源碼文件在哪裡

pandas源碼文件在哪裡

科技 更新时间:2024-12-22 00:15:48

全文共2220字,預計學習時長6分鐘

pandas源碼文件在哪裡(你的寶藏庫已上線)1

圖源:unsplash

Github的大名想必無人不知,無人不曉。一些新手或許會不敢接觸Github,但同為初學者,我非常清楚Github的用途遠不止管理項目版本。除了人人都可參與的開源項目以外,Github上還有豐富的學習資源。

網課固然讓人受益良多,但輔以練習才能鞏固新知。一些常用網站,例如“Codewars”和“Codekata”,提供每日練習,用戶可根據自身需求選擇語言并解題。

如果要針對Pandas進行強化練習,可以參考下列四大可供學習Pandas的Github代碼倉庫。其中一個代碼倉庫經Fork次數最多,受衆層次廣,Pandas新手以及進階學習者都可使用。

Pandas Exercises——多種類數據(4k Forks)

pandas源碼文件在哪裡(你的寶藏庫已上線)2

Pandas Exercises代碼倉庫截圖

該代碼倉庫由11個部分組成,涵蓋了從數據預處理到高級數據可視化等内容。每個文件夾中有多個數據集,包含不同的練習。

用戶可下載IPYNB文件,打開Jupyter notebook,親自動手一試。可将代碼輸入題目下方的空白cell框格中,并查看“Exercise_with_Solution.ipynb”文件以核對答案。

該代碼倉庫資源綜合性強,共有27個notebook可供使用。即使已經熟悉Pandas,“入門須知(Getting and knowing)”部分也值得一看,或許可從中新學到.describe(include=all) 和 .nunique()等函數。

Pandas Videos——多種類數據/含視頻(1.2k Forks)

pandas源碼文件在哪裡(你的寶藏庫已上線)3

Pandas Videos代碼倉庫截圖

該代碼倉庫内含的Jupyter notebook附有代碼,其代碼來自于一個介紹Pandas多種不同功能的系列視頻。作者使用真實數據集,遍曆了解決問題的全過程,将其寫進notebook中并發布于網上。

理想狀态下,打開Jupyter notebook後便會随之播放視頻。視頻和代碼都浏覽完畢後,可将代碼倉庫中的notebook作為“答題紙”。這些notebook中還附有腳注,有助于厘清特定cell框格的輸出結果。

這些視頻與相應的notebook綜合性極強。對于Pandas相關的疑問,諸如“如何對Pandas中的Series和Dataframe進行排序”等簡單小問題,或是“如何用Pandas和sci-kit learn在Kaggle完成提交”等複雜大問題,都能在這一代碼倉庫中獲得解答。

100 Pandas Puzzles(1k Forks)

pandas源碼文件在哪裡(你的寶藏庫已上線)4

100 Pandas Puzzles代碼倉庫截圖

該代碼庫中含有一個Jupyter notebook文件和一些練習以供下載。用戶可将代碼填入問題下方的cell框格中,并可與“solutionsnotebook”文件中的相應cell框格進行比對。

notebook由不同部分組成,包括“導入Pandas(Importing Pandas)”、“DataFrame基礎知識(DataFrame basics)”和“Series與DatetimeIndex(Series andDatetimeIndex)”等。大多數問題并不需大段代碼,在理想情況下僅用寥寥幾行即可解決。

該代碼倉庫中的“掃雷(Minesweeper)”部分很有趣,内容包含:創建DataFrame,使其内含掃雷遊戲的必要數據,包括方格坐标值、格内是否含雷及其相鄰方格中的含雷數量。“掃雷”中等偏難,對于已完成之前練習的人來說,仍屬力所能及之範圍。有别于傳統的數據分析,該部分考察了在特殊場景中運用DataFrame的能力,頗具趣味性。

作者也指出了題目列表尚不完整,有意完善題目的人可以提出申請,以獲取更多練習、做出更正和改進。

Pycon 2019 Tutorial——中等難度(180 Forks)

pandas源碼文件在哪裡(你的寶藏庫已上線)5

Pycon 2019 Tutorial代碼倉庫截圖

該代碼倉庫中含有一個極長的notebook,其中有作者在自制的“使用Pandas的最佳數據科學實踐(Data Science Best Practices with Pandas)”視頻中讨論到的代碼。該代碼倉庫不含Pandas的基礎知識,因此适合中等水平的Pandas用戶使用。

它共有八個主要部分,并不十分遵循“教程”模式,更類似于真實的數據分析項目,從數據檢驗、數據清洗到創建初步可視化,以幫助解答一些具體的問題,例如“平均來說,哪類職業的工作者發表的TED演講最為有趣?”等。

對于剛接觸Python和Pandas的數據分析項目的新手來說,可以觀看整個視頻來學習他人如何完成數據清洗、探索和分析等不同步驟,取其精華并活用于自己的項目之中。

學習的途徑多種多樣,你不妨從中選取符合自己Pandas水平的學習資源,在Github上一試身手。

pandas源碼文件在哪裡(你的寶藏庫已上線)6

留言點贊關注

我們一起分享AI學習與發展的幹貨

如轉載,請後台留言,遵守轉載規範

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved