OpenPyXL簡介(發音:openpixel)
如果您在2010年之前進入就業市場,那麼所需的最常用技能集之一是Microsoft Excel。
現在有一天,了解Microsoft Excel不僅是一項要求,而且幾乎沒有必要放上簡曆,因為假設每個人都知道如何使用它。
處理數據的大多數工作和任務都需要您處理電子表格。
這可能看起來像是#tbt,或者背離了我們對Pandas庫和python功能的樂趣,但是保持在我們衆所周知的工具箱的最前沿仍然非常重要。
為什麼?
好吧,底線,公司和管理層仍然嚴重依賴于Microsoft Excel電子表格和.xlsx文件類型,并且它們不會很快到達任何地方。
雖然許多企業已經意識到Excel的低效率,但許多公司仍然依賴它,如果沒有其他原因,除了純粹的習慣力。“ 企業時報”發表的一篇文章報道稱,美國約有60%的企業仍然依賴電子表格,而21%的企業正在轉向其他軟件解決方案。
例如,您可能有一項無聊的任務,即
從一個電子表格中複制某些數據并将其粘貼到
另一個電子表格中。或者,您可能需要經曆數千行,并根據某些标準選擇少數行進行小編輯。或者您可能需要查看數百個部門預算電子表格,搜索任何紅色的電子表格。這些正是Python可以為您做的那種無聊,無意識的電子表格任務。
- 自動化無聊的東西
因此,作為pythonistas,我們需要找出一種pythonic方式來處理這個重要的無所不在的現象。我們的解決方案:
- openpyxl:使用python讀取和寫入.xlsx文件的推薦包。一般可以處理以下包的用例。
- xlsxwriter:用于讀取和寫入文件以及格式化.xlsx文件的替代包。适用于格式化信息和圖表。
- xlrd:這個包适用于讀取和格式化舊版本的excel文件(.xls)
- xlwt:用于在舊(.xls)格式的文件中寫入和格式化信息的包。
- xlutils:收集需要xlrd和xlwt功能的實用程序。包括過濾現有excel文件的功能。
使用這些包,我們可以直接從Python讀取,編輯和創建.xlsx文件類型。
Numpy,Pandas和我們最喜歡的許多python庫和軟件包都可以輕松地與OpenPyXL集成,以自動執行任務并收集和分析數據。
為什麼不直接使用Pandas和.CSV文件類型?
- CSV(逗号分隔值)文件類型隻有2種數據類型 - 字符串和數字
- CSV是壓縮文件類型,很容易損壞。
- CSV不保存和傳輸公式。
- 世界上沒有關于分離價值的标準 - 美國的逗号,可能在德國使用短劃線或管道。
- XLXS文件類型包含所有内容或沒有任何内容,如果文件損壞,您将不會丢失部分數據。
- XLXS文件比CSV更具可操作性。
- XLXS支持更多數據類型 - 它有自己的内置日期類型。日期時間,浮點數,百分比......
仔細看看OpenPyXL
入門:
安裝-
在終端
$ pip install openpyxl
為了能夠在我們的Excel工作簿中包含圖像文件,我們還需要安裝枕頭:
$ pip install pillow
Pillow(PIL) - Python Imaging Library是一個免費的Python編程語言庫,它增加了對打開,操作和保存許多不同圖像文件格式的支持。
我們可以使用Openpyxl包執行的功能和事情:
- 創建工作簿,創建工作表,創建工作表副本。
- 使用函數循環顯示工作表(For Loops)。
- 訪問一個單元格或多個單元格并使用數據。
https://openpyxl.readthedocs.io/en/stable/usage.html
底線:
OpenPyXL和其他與Python集成的軟件包可以讓您的生活更輕松,節省您的時間,讓您成為辦公室和客戶的最愛。
進一步閱讀:
OpenPyXL官方文檔
python小白社群之Python遇到excel-1
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!