tft每日頭條

 > 科技

 > python如何進行數據分析

python如何進行數據分析

科技 更新时间:2025-01-28 11:18:02
預告:後邊一段時間,我會分享一系列關于Python數據分析的内容,為大家展示一個數據分析師需要掌握什麼知識,具備什麼樣的技能,感興趣的可以先關注下。

要使用強大的Python數據分析模塊pandas,我們首先要熟悉它的兩個主要的數據結構:Series(序列)和DataFrame(數據框),或許它們無法解決所有的問題,但它們為大多數應用提供了一種可靠的、易于使用的基礎。

1.生成Series(序列)

Series是一種類似于一維數組的對象,它由一組數據以及一組與之相關的數據标簽組成。

僅由一組數據即可産生最簡單的Series,其字符串表現形式為:索引在左邊,值在右邊。

如果我們沒有為數據指定索引,那麼它會自動創建一個0到N-1(N為數據的長度)的整數型索引。

我們可以通過Series的values和index屬性獲取其數組表示形式和索引對象:

python如何進行數據分析(Python數據分析入門Series快速上手)1

2.通常,我們希望所創建的Series帶有以各可以對各個數據點進行标記的索引:

python如何進行數據分析(Python數據分析入門Series快速上手)2

可以看到,與普通NumPy數組相比,我們可以通過索引的方式選取Series中的單個或一組值,甚至可以進行賦值操作。

3.對Series進行NumPy數組運算(如根據布爾型數組進行過濾、标量乘法、應用數學函數等)時都會保留索引和值之間的鍊接。

python如何進行數據分析(Python數據分析入門Series快速上手)3

4.還可以将Series看成是一個定長的有序字典,因為它是索引值到數據值的一個映射,它可以用在許多原本需要字典參數的函數中。如果數據被存放在一個Python字典中,也可以通過這個字典來創建Series。

python如何進行數據分析(Python數據分析入門Series快速上手)4

可以看到,如果隻傳入一個字典,則結果Series中的索引就是原字典的鍵(有序排列)。

我們還可以同時傳入一個字典和一個索引列表(元組和數組也可以,如下圖所示),如下圖的例子,sdata中跟states索引相匹配的值會被找出來,并按照順序放到相應的位置。

python如何進行數據分析(Python數據分析入門Series快速上手)5

但由于‘California’所對應的sdata值找不到,所以其結果為NaN(not a number,非數字,在pandas中,用于表示缺失或NA值)。pandas中的isnull()和notnull()函數可用于檢測缺失數據。同時,Series也有類似的實例方法(對于pd.isnull(obj4)我們稱之為對實例obj4應用函數pd.isnull(),對于obj4.isnull()我們一般稱之為實例obj4的方法isnull()):

python如何進行數據分析(Python數據分析入門Series快速上手)6

對缺失數據的處理,永遠是數據分析和數據挖掘過程中的重要一環,我們将會在後續的内容中詳細讨論。

5.對于許多應用而言,Series最重要的功能是:它在算數運算中會自動對齊不同索引的數據。關于數據對齊的内容我們也會在後續單獨講解。

python如何進行數據分析(Python數據分析入門Series快速上手)7

6.Series對象本身及其索引都有一個name屬性,該屬性跟pandas其他的關鍵功能關系非常密切。Series的索引可以通過賦值的方式就地修改。

python如何進行數據分析(Python數據分析入門Series快速上手)8

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved