python批量編輯教程-tft每日頭條

python批量編輯教程

科技更新时间:2025-12-21 18:42:01

python批量編輯教程（Python辦公自動化批量處理文件）1

注1: 本文對應的教學視頻私信我“學習”獲取！

注2: 以上代碼需在Python3環境下運行

要說在工作中最讓人頭疼的就是用 同樣的方式處理一堆文件夾中文件 ，這并不難，但就是繁。所以在遇到機械式的操作時一定要記得使用Python來合理偷懶！今天我将以處理微博熱搜數據來示例如何 使用Python批量處理文件夾 中的文件，主要将涉及：

Python批量讀取不同文件夾( :star: :star: :star: )
Pandas數據處理( :star: :star: )
Python操作markdown文件( :star: )

需求分析

首先來說明一下需要完成的任務，下面是我們的文件夾結構

python批量編輯教程（Python辦公自動化批量處理文件）2

因為微博曆史熱搜是沒有辦法去爬的，所以隻能寫一個爬蟲每天定時爬取熱搜并保存，所以在我當時分析數據時使用的就是上圖展示的數據， 每天的數據以套娃形式被保存在三級目錄下 ，并且熱搜是以markdown文件存儲的，打開是這樣:point_down:

python批量編輯教程（Python辦公自動化批量處理文件）3

而我要做的就是将這三個月的微博熱搜數據處理成這樣:point_down:

python批量編輯教程（Python辦公自動化批量處理文件）4

這困難嗎，手動的話無非是依次 點三下 進入每天的數據文件夾再打開md文件 手動複制粘貼 進Excel，不就幾萬條數據，大不了一天不吃飯也能搞定！現在我們來看看如何 用Python光速處理。

Python實現

在操作之前我們來 思考一下如何使用Python實現 ，其實和手動的過程類似：先 讀取全部文件，再對每一天的數據處理、保存。所以第一步就是将我們需要的 全部文件路徑提取出來 ，首先導入相關庫

import pandas as pd import OS import glob from pathlib import Path

讀取全部文件名的方法有很多比如使用 OS模塊

python批量編輯教程（Python辦公自動化批量處理文件）5

但是由于我們是多層文件夾，使用 OS模塊隻能一層一層讀取，要寫多個循環從而效率不高，所以我們告别 os.path 使用 Pathlib 來操作，三行代碼就能搞定，看注釋

from pathlib import Path p = Path("/Users/liuhuanshuo/Desktop/熱搜數據/") #初始化構造Path對象 fileList=list(p.glob("**/*.md")) #得到所有的markdown文件

來看下結果

python批量編輯教程（Python辦公自動化批量處理文件）6

成功讀取了熱搜數據下多層文件夾中的全部md文件！但是新的問題來了，每天有兩條熱搜彙總，一個11點一個23點，考慮到會有 重合數據 所以我們在處理之前先 進行去重 ，而這就簡單了，不管使用 正則表達式 還是按照奇偶位置提取都行，這裡我是用 lambda表達式 一行代碼搞定

filelist = list(filter(lambda x: str(x).find("23點") >= 0, FileList))

現在我們每天就隻剩下23點的熱搜數據，雖然是markdown文件，但是Python依舊能夠輕松處理，我們打開其中一個來看看

python批量編輯教程（Python辦公自動化批量處理文件）7

打開方式和其他文件類似使用 with語句 ，返回一個list，但是這個list并不能直接為我們所用，第一個元素包含時間，後面每天的熱搜和熱度也不是直接存儲，含有markdown語法中的一些沒用的符号和換行符，而 清洗這些數據 就是常規操作了，使用下面的代碼即可，主要就是使用正則表達式，看注釋

with open(file) as f: lines = f.readlines() lines = [i.strip() for i in lines] #去除空字符 data = list(filter(None, lines)) del data[0] data = data[0:100] date = re.findall('年(. )2',str(file))[0] content = data[::2] #奇偶分割 rank = data[1::2] #提取内容與排名 for i in range(len(content)): content[i] = re.findall('、(. )',content[i])[0] for i in range(len(rank)): rank[i] = re.findall(' (. )',rank[i])[0]

最後隻需要 寫一個循環遍曆 每一天的文件并進行清洗，再創建一個DataFrame用于存儲每天的數據即可

python批量編輯教程（Python辦公自動化批量處理文件）8

可以看到，并 沒有使用太複雜的代碼 就成功實現了我們的需求！

結束語

以上就是使用Python再一次解放雙手并成功偷懶的案例，可能讀取Markdown文件在你的日常工作中并用不到，但是通過本案例希望你能學會 如何批量處理文件夾 ，批量讀取清洗數據。更重要的是在你的工作學習中，遇到需要重複操作的任務時，是否能夠想起使用Python來自動化解決！拜拜，我們下個案例見～

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技為什麼寶馬沒有備胎
1、其實寶馬設計師，考慮的問題還是很周到的，考慮到大部分車主都不會自己更換輪胎，出于人性化的考慮，采用了一種不怕紮、不會爆的輪胎，就是防爆胎。2、寶馬車這種防爆胎與普通車的輪胎相比，其主要優勢是，即使輪胎遭遇了爆胎的情況，依然可以以80公裡每小時的速度行駛80公裡以上。這個行駛路程是絕對能夠支撐駕駛者找到最近的一個汽車修理店進行修理的。3、其次防爆胎的胎壁很厚，支撐性非常強，大大降低車輛因爆胎而導 2023-07-06
科技電腦買什麼牌子的好
1、IBM，外号“小黑”，給人第一印象，結實耐用，優點：質量是不用說的，就像它廣告做的那樣，殼很厚，... 2023-07-06
科技多閃可以群發嗎
1、首先我們打開多閃，然後在多閃的首頁中看到消息按鈕，點擊消息按鈕可以看到好友列表。2、點擊選中的好友後我們就進入了好友的聊天界面，此時我們點擊界面中心的圓圈進行拍攝視頻。3、進入視頻拍攝界面後，調整好角度，然後點擊下面的圓，按住不放開始拍攝自己的視頻。4、拍攝好視頻以後我們就進入了視頻的處理階段，這裡我們可以用上面的工具對視頻進行處理，然後點擊右下角的發送按鈕。5、點擊了發送按鈕後我們的多閃視頻 2023-07-06
科技幼兒園一周食譜
第一、幼兒園的寶貝們飲食一定都有自己的飲食習慣，首先要确定孩子們的過敏源，如果有，如果是孩子統一吃飯的情況下，一定要避免這些過敏源，不要有過敏情況的發生。同時也要根據孩子們的生長階段和身體特點。南瓜是首先要推薦的，它可以做成南瓜粥或者南瓜羹，對于寶寶們的腸胃非常好。第二、飲食也要根據季節，夏天天氣熱，孩子們活動量偏大，需要補充鹽分，也需要散熱，可以吃一些帶有綠豆的食品，綠豆粥或者下午的小蛋糕可以吃 2023-07-06
科技微信收款記錄怎麼删除
1、打開微信，點擊我”，進入錢包；2、進入錢包後點擊右上角四方格；3、點擊賬單；4、能看到收付款記錄，查找需要删除的記錄。5、長按該條記錄，彈出删除按鈕，點擊删除。 2023-07-06
科技蘋果手機電沒用完可以充電嗎
1、日常使用中，蘋果手機最好不要用到自動關機，而是在手機的電量用到20%-40%的時候就對手機進行充電最好，充滿即可拔下。2、早期的手機使用的是鎳镉電池和鎳氫電池，鎳镉電池和鎳氫電池需要類似的激活”。3、這些電池會産生記憶效應”，在不完全放電的狀态下充電，易使電池過度充電，時間長了會讓使用者覺得電很快就用完了所以第一次需要充滿12個小時，且每次最好用到沒電了再充。4、iphone手機上所用的電池， 2023-07-06
科技觀音蓮如何移栽
1、用左手輕輕兜住觀音蓮上部，右手抓住盆子輕輕擠壓（塑料盆可以這樣操作，如果是陶盆、陶瓷盆等就把盆放在地上輕輕磕），使土、盆分離。下圖是已經分開的樣子，原來的土塊結闆很嚴重，不夠透氣，影響其根部吸收。2、土實在太結闆了，需要你費了勁兒松開，剩下的土都是用手慢慢搓掉的，下圖的觀音蓮基本可以算是土、根分離了。觀音蓮白色的粗根還是很健康的。3、把長得不夠健康的根須都修剪掉了，隻留下健康的、強壯的主根，大 2023-07-06
科技空調sansui是什麼牌子
演示機型：sansuiKFRd-51GW/CECL10+3系統版本：定頻空調空調sansui的牌子是山水。山水作為全球影音市場的領導企業，擁有着七十年的悠久曆史，主要從事通信設備、電子産品、家用電器的技術開發，生産制造并運營銷售安全可靠的、簡單易用的技術産品以及優質的服務。山水：是全世界曆史最悠久、規模最大的影音企業之一。于1944年在日本東京成立，創始人菊地幸作先生。經過七十年的發展，山水的企業 2023-07-06
科技愛奇藝全屏卡頓解決方法
以Iphone12，ios14，愛奇藝7.5112.1843為例：點擊進入愛奇藝視頻觀看界面。擊界面中的“我的”，在我的界面，滑動屏幕，在此界面中找到設置功能。點擊進入設置界面，找到界面中的播放與下載功能，點擊進入播放與下載界面。在播放與下載界面找到播放時啟動硬件加速，滑動其後方的滑扭，将其關閉後再重新打開，調整視頻卡頓問題。愛奇藝：愛奇藝是由龔宇于2010年4月22日創立的在線視頻網站，2011 2023-07-06
科技地下水井的水源結構
1、地下水井的水源結構一般分為淺層地下水(地質結構中位于第一透水層中、第一隔水層之上的地下水。由大氣... 2023-07-06
科技 7代雅閣如何降低油耗
1、首先您看一下因路況及駕駛習慣出現的油耗高問題。汽油車火花塞，高壓線有問題，引起點火電路不正常，可以通過檢修更換另件解決油耗高。2、刹車系統有問題，刹車片不回位，行駛阻力加大等，可以通過檢修恢複降低油耗。3、汽車油路不暢，積碳堵塞，使用燃油清洗劑清洗噴油咀和節氣門及發動機積碳，可以降低油耗。 2023-07-06
科技 win7電腦藍牙驅動怎麼安裝
1、第一步，這裡以華碩筆記本藍牙驅動”為演示例子。首先，查到電腦的型号，選中菜單【開始】--【運行】或使用快捷鍵（組合鍵：Win鍵+R鍵）打開運行窗口。2、第二步，輸入命令【dxdiag】并确定啟動DirectX診斷工具。3、第三步，【系統】--【系統信息】下可以查看到筆記本的型号。4、第四步，進入華碩筆記本的中文官網，點擊【服務與支持】菜單。5、第五步，搜索筆記本相應的型号，如K42JZ。6、第 2023-07-06
科技哔哩哔哩怎麼發視頻
1、打開手機哔哩哔哩軟件，更新到最新版本，以前的老版本手機app不支持視頻上傳。2、登錄個人賬号，點擊賬号頭像，進入後台頁面，選擇投稿”。然後選擇視頻”。3、入視頻文件夾内，選擇你手機裡事先準備好的視頻，然後點擊下一步”。4、進入編輯視頻”，可以對視頻進行簡單的處理，比如加上背景音樂、文字等等。5、視頻編輯完後，選擇下一步”，再根據提示填寫視頻标題、類型、标簽等信息。 2023-07-06
科技微表格和excel表格的區别
以華為MateBookX，win10，微表格excel3.11為例。微表格是基于OfficeExcel而開發的一款表格數據處理軟件，在使用過程中根本就不需要安裝Excel，能夠獨立運行，更好的處理表格的數據整體也非常簡單，完全抛棄了一些複雜的部分，操作更加簡單實用。而Excle表格是一款方便快捷的表格合并工具，也可以把多個不一樣的表格放在一起合并的操作，能夠有效的提升工作的效率。 2023-07-06
科技榔榆盆景的養殖方法是什麼
1、選擇好樁景、處理樁景。選擇榔榆樁景是首要工作，盡可能選擇長勢比較好、根系保存較為完整的榔榆樁景進行培育。選好樁景以後要對其進行簡單的處理。将榔榆樁景的截面和有傷口的地方進行适當的休整，将上面的雜質清理好，減少細菌的感染，影響榔榆盆景後續的生長。2、選花盆和盆土。榔榆盆景選花盆也是非常關鍵的，要搭配出美感來才能體現其欣賞價值。你可以選擇陶瓷盆，美觀又透氣，最重要是根據你自己的喜好來定。盆土的話選 2023-07-06
科技手機連無線網老是掉線怎麼回事
以華為P40，Android11為例。1、手機無線WLAN設置問題：若隻有自己手機連接無線網掉線的情況下，一般為手機WLAN設置問題，可打開手機設置，進入無線網設置，選擇高級設置，裡面有一個休眠時保持WLAN連接，将此項設置改為始終。2、省電模式導緻：有些手機的系統省電模式可能會導緻連接無線不穩定，在這種模式下，手機會自動降低無線模塊的功率，達到省電的目的，這樣就會造成無線連接不穩定經常掉線，試一 2023-07-06
科技蘋果關機了鬧鐘還會響嗎
演示機型：Iphone12系統版本：iOS14.4.1不會。由于iOS系統裡面沒有設置這個功能，并不能和一些安卓系統手機一樣可以設置關機鬧鐘響叫功能。iPhone，是蘋果公司研發的智能手機，它搭載蘋果公司研發的iOS操作系統。第一代iPhone于2007年1月9日由蘋果公司前首席執行官史蒂夫·喬布斯發布，并在同年6月29日正式發售。iPhone手機的幾個小功能介紹：1、在短信或微信或 2023-07-06
科技香椿木可以做家具嗎
1、香椿木家具特點：香椿木比較耐腐蝕，文理清晰，而且還可以防治蛀蟲，經過手工打磨後的香椿木家具，材色紅潤，用的時間越長，表面光澤度越亮，本就帶有的特定的香味，長時間接觸香椿木家具對身心健康也是非常有幫助的。2、香椿木家具的優點遠不止這麼些，而且在人們心中香椿木的價值也水漲船高，所以香椿木在現代也被許... 2023-07-06
科技紅綠燈處的限速是多少
1、紅綠燈或者斑馬線時，沒有時速限制，但不能超過該條道路的限速；如果紅綠燈是出現在道路的十字路口或者轉彎處，則時速不可以超過30碼。一般是30到60之間。2、過紅綠燈路口減速慢行，是基本的安全常識。40時速有時間做出反應，而80時速飙過，很容易反應不及，釀成大禍。無論有沒有信号燈，無論是紅燈還是綠燈，都要提前減速，看綠燈時間，如果夠用就果斷踩油門通過，如果快到黃燈了，就要提前減速了，甯停三分、不搶 2023-07-06
科技看别人小紅書有痕迹嗎
演示機型：Iphone12&&華為P40&&小米11系統版本：iOS14.4&&EMUI11&&MIUI12.0.7APP版本：小紅書6.95.1看别人小紅書沒有痕迹。小紅書沒有訪客記錄，所以浏覽别人的作品對方不會知道。隻有收藏、點贊及評論對方才會收到提示。小紅書：小紅書是一個生活方式平台和消費決策入口，創始人為毛文超和瞿芳。小紅書月活躍用戶數過億，其中70%新增用戶是90後。在小紅書社區，用戶通 2023-07-06
科技手機開機黑屏怎麼解決
1、首先确保手機在關機狀态，然後同時按住電源鍵+音量上鍵+home鍵。2、等到手機出現開機提示即可松手，之後就會進入recovery模式。3、進入recovery模式後，點擊清除并恢複出廠設置”和清除緩存數據”。4、最後重啟手機即可解決。 2023-07-06
科技 mate30pro是5g嗎
1、華為Mate30全系将提供5G版本，即華為Mate305G、Mate30Pro5G和Mate30ProRS版本支持5G網絡，所以想要體驗5G移動網絡的用戶，可以選擇華為Mate30Pro5G版。2、華為Mate30Pro還将搭配自研的巴龍5000基帶芯片，從而實現對于5G網絡的支持，而這一點也是被聯通近期公布的5G終端表側面印證。 2023-07-06
科技車載低音炮安裝在什麼位置好
1、如果是箱式低音炮的話，應該放置在後備箱裡面，不僅可以起到很好的低音效果，而且還有環繞聲的效果。再加上低音炮的體積本身就比較大，如果放到車内的話多多少少都會有點不方便，所以放到後備箱才是最佳的選擇。2、但對于一些輕薄型的低音炮來說，低音震撼感是相對比較弱的，放到後備箱的效果自然是沒那麼好，最好就是放置在汽車中部座椅下，使得整個車内有很好的音樂效果。3、至于車載重低音炮有必要嗎這個問題，如果你真的 2023-07-06
科技 iphone6s内存不夠怎麼辦
1、照片視頻太多。如果您的舊照片和視頻較多，内存顯示占有量很大的話，可以下載百度雲或是騰訊微雲等其他網絡硬盤。在網絡良好的情況下，把您的照片上傳到網絡硬盤中，再删除手機系統中的照片和視頻。如此一來，照片和視頻仍可得到保存，而内存也可以得到緩解。2、手機應用過多。在當下，各色各樣的應用APP占據了手機内存的半壁江山。而蘋果APPStore裡的應用大小，是遠大于其他系統的應用大小。為解決這一問題，您可 2023-07-06
科技 qq單向好友是什麼意思
演示機型：Iphone12&&華為P40&&小米11系統版本：iOS14.4&&EMUI11&&MIUI12.0.7APP版本：qq8.8.0qq單向好友是指qq号裡，沒有對方的好友（沒有對方QQ号），而對方的QQ裡面有你。出現這種情況有兩種原因：對方曾經添加過你的好友，你也同意添加，但是沒有添加過對方為好友；你曾經把對方的QQ号删除過，不過在删除的過程中，沒有同時删除對方列表中的自己。qq功能： 2023-07-06
科技自潔素傷車漆嗎
1、傷。2、自潔素主要用來清洗輪胎、輪毂上的污漬，而市面上的自潔素堿性一般都非常高，基本屬于燒堿範疇，即便是稀釋到1：100，還是強堿性，有很強的腐蝕性。使用市面上所謂的免擦拭自潔素洗車，洗壞車漆的情況有很多，在清潔的同時對人體和車輛也可能會造成很大傷害。因此，自潔素傷車漆，不可以直接洗車，需要大家謹慎使用。3、清潔能力不能代表一款清潔劑的好壞，清潔隻是清潔劑的一個作用。清潔劑在清潔的同時，能否保 2023-07-06
科技騰訊QQ怎麼删除表情包
1、登錄QQ，任意打開一個聊天窗口并點擊表情選項。2、在表情包界面選擇要删除的表情，或者選擇需要删除的分組，然後右鍵點擊删除分組即可。3、或者先删除自己不要的包情包也是可以的喲，那就要一個一個的删除了，可能有些麻煩喲。 2023-07-06
科技電腦強制關機關不了機怎麼辦
1、點開始→設置→控制面闆→電源選項→高級電源管理”，如果你的機器支持高級電源管理功能，則選中啟用高級電源管理支持”。2、單擊開始”，并運行regedit”，然後在HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsNTCurrentVersionWinlogon中找到PowerdownAfterShutdown，并将值設為1。3、最後重啟便可解決。 2023-07-06
科技小孩總是流口水導緻嘴周圍濕疹
第一、很多寶媽對嘴部濕疹是沒有什麼概念的，以為就是嘴邊因寶寶經常流口水用紙巾擦多了的原因，其實那一小片紅紅的就是濕疹了。很多寶媽認為寶寶得了濕疹不用治療，等孩子大了，自己就會好了。這種說法是不正确的。雖然等到寶寶1歲以後濕疹會有所好轉，但是長期的濕疹導緻寶寶皮膚瘙癢，很不舒服，甚至會影響到寶寶的睡眠。另外，長期濕疹的寶寶皮膚屏障功能會損害的更加嚴重，過敏原等緻病物質更容易入侵體内，随着孩子長大，還 2023-07-06
科技 i5-5200u怎麼樣
1、這是筆記本節能版的處理器，主頻較低，幾年前在筆記本處理器中還算是中高端，但現在隻能算中低端了cpu型号末尾帶字母U”的為低電壓處理器，适合中低性能需求的用戶。2、如果你隻是用來看網頁、看視頻、聽音樂、普通辦公，這個強度對性能要求不高，就可以買這個cpu的筆記本。 2023-07-06

tft每日頭條

> 科技

> python批量編輯教程