在python中有很強大的數據分析包,能夠幫助我們解決很多數值上、可視圖、方程組和積分等難題,如數據科學包numpy、pandas、matplotlib可視圖、scipy、scilkit-learn等。其中的numpy、matplotlib可視圖,筆者就不再介紹了,需要學習的朋友請看我以前的文章。numpy的文章鍊接是:python科學數據分析numpy工具庫最全教程,讓你快速掌握這一框架
matplotlib可視圖的教程鍊接是:
python可視圖matplotlib 2D/3D圖表,讓你快速掌握制作常用的圖表
今天筆者來介紹pandas、SciPy和scikit-learn數據包:
1.安裝 要學習這些數據包的模塊,首先要進行安裝數據包操作,安裝講解如下:
numpy、pandas和matplotlib模塊的安裝時沒有什麼前提條件的,而SciPy模塊的安裝,就需要在确保numpy已經安裝好的條件下才能進行SciPy模塊的安裝;scikit-learn在安裝前也要确保numpy、SciPy、matplotlib模塊已經安裝好的條件下才能進行安裝,所以筆者建議讀者以下面建議的安裝順序去安裝:
【1. numpy】—【2. matplotlib】—【3. pandas】—【4. SciPy】—【5. scikit-learn】
window環境下安裝(按【win R】鍵打開終端)輸入一下命令進行安裝:
其他的也類似(注意:要确保網絡運行正常條件下才能順利安裝)
Linux環境下安裝,輸入一下命令進行安裝:
其他的也類似(注意:要确保網絡運行正常條件下才能順利安裝)
注意:pandas安裝成功後,還需要進行如下的安裝工作,才能支持pandas對Excel進行讀寫操作:
安裝工作完成後,下面開始講解pandas、SciPy和scikit-learn簡單入門的實例講解:
2.pandas數據分析包簡單入門教程: 為什麼要學習pandas模塊呢?要知道pandas 是python下最強大的數據分析和探索工具 功能有哪些?:支持類似SQL的數據增、删、查和改,有豐富的數據處理函數; 支持時間序列分析功能;支持靈活處理缺失數據;着重數據的讀取、處理和探索等功能。
pandas有兩個函數很重要,一個是Series函數,用來生成序列的,類似于一維數組,另外一種函數是DataFrame函數,類似于一個二維的表格。
(1)常規操作,兩大函數應用 實例代碼如下:
運行結果如下截圖所示:
(2)讀取csv文件、Excel表格中的數據 csv文件和Excel表格已經存在的條件下,例如筆者的文件如下:
實例代碼:
運行結果截圖:
3.SciPy簡單入門教程: 介紹一下SciPy有什麼作用呢?
1.numpy 提供多維數組功能,而scipy提供了真正的矩陣 2.scipy的功能:最優化、線性代數、積分、插值、拟合、特殊函數、快速傅裡葉轉換、信号處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算
實例代碼和運行結果如下:
4.scikit-learn簡單入門教程: scikit-learn有什麼用?
這是一個機器學習庫,包括數據預處理、分類、回歸、聚類和模型分析
創建一個機器學習的模型
實例代碼和結果截圖如下:
今天的内容主要是跟大家介紹這些數據科學包模塊的一些入門的概念和一些簡單的操作實例,學完上面這些,對這些數據科學包也有初步的認知了。
今天的内容到此就結束了,喜歡的朋友可以關注一下【python是一個時代】,更多精彩内容等着你,也可以轉發給需要學習的朋友學習學習,希望今天的内容對讀者有所幫助。
紙上得來終覺淺,絕知此事要躬行
——【python是一個時代】
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!