tft每日頭條

 > 圖文

 > pythonpandas常用索引方式

pythonpandas常用索引方式

圖文 更新时间:2024-05-09 18:26:46

pythonpandas常用索引方式?前言:今天為大家帶來的内容是:pandas DataFrame中的tuple元素遍曆的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面随着小編來一起學習學習吧,我來為大家科普一下關于pythonpandas常用索引方式?下面希望有你要的答案,我們一起來看看吧!

pythonpandas常用索引方式(python基礎知識PandasDataFrame中的tuple元素遍曆的實現)1

pythonpandas常用索引方式

前言:

今天為大家帶來的内容是:pandas DataFrame中的tuple元素遍曆的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面随着小編來一起學習學習吧!!!

pandas中遍曆dataframe的每一個元素

假如有一個需求場景需要遍曆一個csv或excel中的每一個元素,判斷這個元素是否含有某個關鍵字

那麼可以用Python的pandas庫來實現。

方法一:

pandas的dataframe有一個很好用的函數applymap,它可以把某個函數應用到dataframe的每一個元素上,而且比常規的for循環去遍曆每個元素要快很多。如下是相關代碼:

代碼中,bool_array為一個邏輯矩陣,滿足條件元素的位置為true,否則為false。然後通過邏輯矩陣去索引dataframe1,就可以得出滿足條件的元素。

方法二:

第一種方法是一次性遍曆每個元素,這樣不好分column去處理,那換一種方式可以每次遍曆一列。

代碼種 Series.str.contains 是 Series 才有的一個操作。另外,filter_data隻輸出每一列中滿足條件的元素,更方便下一步的操作。

簡單說明:

針對pandas的dataframe和series,有強大的高階函數:apply,applymap和map函數等,它們比簡單的for循環要快很多,善用這些高階函數會讓你事半功倍。

Pandas DataFrame中的tuple元素遍曆

在用Word2vec計算出詞語的相似度之後,得到的DataFrame格式如下:

1. 索引(index)為輸入的關鍵詞,從第0列開始為相似度最高的詞語和它的餘弦相似度。

2. 這個DataFrame 中每一個元素,比如(通話, 0.21321064233779907)的格式為tuple。

輸入數據:

期望輸出的數據

1. 隻取相似度最高的詞語,丢棄餘弦相似度。

2. 把關鍵詞從索引中取出來,單獨作為1列。

期望輸出:

Python 實現的代碼:

主要使用1)applymap,2)lambda,3)reset_index,4)rename

以上就是本文的全部内容,希望對大家的學習有所幫助!!!

最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,并在後台私信小編:“07”即可領取。

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved