python爬蟲進程和線程-tft每日頭條

python爬蟲進程和線程

生活更新时间:2025-08-18 11:02:47

最近golang寫得多，但是采集數據還是習慣性地切換到了python。

業務需求

采集gif圖片和文字（非商業使用）
圖片去除老水印，打上新水印
生成鍊接入庫

過程

1.采集

剛開始調試、測試使用的單線程，經過2個小時，終于跑通了。覺得數據量不大，跑跑一兩個小時也采集完了，實際并沒有。超時中斷了很多次，又不得不做補償措施。前後又折騰了倆小時才跑了一小半的數據，沒跑下來的都是異常的。腦子木了。

因為要處理水印，忍住沒切換到go。

接下來一個小時不到，采用python multiprocessing

爬蟲技術：

import urllib3 as urllib from bs4 import BeautifulSoup from urllib.parse import urlencode, urlparse import multiprocessing

本機：Mac m1, conda env python3.10

采集效率比對：

單線程 444s - 丢失數據，做補償措施也隻跑了不到2/3

多進程 172s - 100%

def scrawl(): t1 = time.time() pools = multiprocessing.Pool(8) missingWords = pools.imap(parsingWord, wordsLeft) pools.close() pools.join() t2 = time.time() print("耗時：", t2 - t1)

技術細節忽略，自我總結：容易被問題套住，跳不出思維怪圈。

2.圖片清洗

接上一篇文章：python pillow-GIF 去除水印并壓縮

因為gif處理流程相對複雜一點，準備在單線程基礎上增加協程并行處理能力。

記錄：

單線程：處理一張gif 耗時26s，優化業務處理流程後16s多。

協程：80張gif圖片-20多分鐘

19:29

因為是單線程發生了IO阻塞，如果時間上不着急，按隊列去理解，是可以接受的

python爬蟲進程和線程（python爬蟲多進程python單線程實現協程）1

python爬蟲進程和線程（python爬蟲多進程python單線程實現協程）2

8CPU也沒快多少，内存消耗減少了，cpu呼呼轉跟風扇似的

python爬蟲進程和線程（python爬蟲多進程python單線程實現協程）3

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活塘可以組什麼詞語
塘可以組什麼詞語?葦塘[wěitáng]生長蘆葦的池塘，下面我們就來說一說關于塘可以組什麼詞語?我們一起去了解并探讨一下這個問題吧!塘可以組什麼詞語葦塘[wěitáng]生長蘆葦的池塘。火塘[huǒtáng]室内地上挖成的小坑，四周壘磚石，... 2022-05-31
生活精靈寶可夢劇場版裂空座超進化
大家好，今天來說說精靈寶可夢的第七部劇場版《精靈寶可夢：裂空的訪問者代歐奇希斯》設定與細節老規矩先說說本部劇場版的背後的故事，本部的烈空坐嚴重不符合原POKEMON的設定。原作中烈空坐屬于最強一列的寶可夢，被譽為不可征服的原始天空之霸主。但... 2022-11-30
生活我的世界打喚魔者模組
介紹一下我的世界的喚魔者生命值24顆心攻擊力六顆心掉落物，零到一個綠寶石，一個不死圖騰，十點經驗值行為喚魔者在林地府邸中單獨生成，并且對玩家和普通村民懷有敵意有用的掉落物被擊殺後，喚魔者會掉落強力的稀有物品——不死圖騰，手持該物品能夠在瀕死... 2022-11-26
生活瘦肉湯怎麼做
瘦肉湯怎麼做?瘦豬肉180克，淡菜90克，紫菜60克淡菜用水浸軟，洗淨；瘦豬肉洗淨，切絲，用鼓油、生抽、鹽、生粉腌10分鐘，紫菜撕成小塊，放鍋内炒片刻，去腥味和砂，用清水浸開，洗淨，下面我們就來說一說關于瘦肉湯怎麼做?我們一起去了解并探讨一... 2022-07-15
生活計算機二級word精講
計算機二級必備幹貨——Word文字處理篇（3）分享興趣，傳播快樂，增長見聞，留下美好！親愛的您，這裡是LearningYard新學苑。今天小編為大家帶來計算機二級必備幹貨——Word文字處理篇（3）。郵件合并考點Word的郵件合并可以将一個... 2022-11-02
生活東郭和狼的故事
我是一個善良的人，從小父親教育我們，要以善為本，發揚父親的傳承，善待身邊的每一個人。直到讓自己的善良害的血本無歸，我才清醒，不是所有的誠意都能換來真心，不是所有的朋友都能變成知己，所以對虛情假意，不知感恩的人的善良，是浪費，是對惡的縱容，是... 2022-10-25
生活英漢交替傳譯中的筆記及語言問題
作者簡介王德懷西北民族大學維吾爾語言文化學院院長、教授、碩士生導師，國家社會科學基金項目成果信譽良好鑒定專家。主要研究突厥語言學，維吾爾語、漢語翻譯理論與實踐。著有《維吾爾諺語翻譯研究》，發表論文三十餘篇，主持、參與國家社科基金重大項目、教... 2022-11-14
生活純蜂蜜會過期嗎
純蜂蜜會過期嗎?土蜂蜜會過期科學研究和初中證明，蜂蜜具有很強的抗菌能力，是世界上惟一不會腐敗變質的食品但根據《食品法》都要在食物上标明保質期，因此，蜂蜜生産廠家一般把蜂蜜保質期定2年，我來為大家科普一下關于純蜂蜜會過期嗎?下面希望有你要的答... 2022-07-12
生活超市世界杯堆頭陳列
一場世界杯，讓“超市大媽”火了！下面跟老納一起看看“超市大媽”的幾組陳列類型，希望給我們的創意帶來一些啟發。足球場足球場造型，适合啤酒和飲料的陳列。因為足球比賽和它們天然分不開，而且瓶瓶罐罐以及箱子的形狀比較接近積木，最容易進行創意擺貨，所... 2023-03-05
生活我國的五音都有什麼
古代的五音為宮、商、角、羽、徵，也有說“五音”為：唇、舌、齒、鼻、喉。唐代時用“合、四、乙、尺、工”。古中樂的“五音”相當于do、re、mi、sol、la少去了半音遞升的“fa”和“si”。五音主要有以下幾種叫法：“五音”：唇、舌、齒、鼻... 2022-10-25
生活 baby的新綜藝叫什麼
baby資源降級嚴重，新綜藝隻能坐邊上，半蹲着給新人拿水果太卑微說起baby相信大家都不陌生，起初因為有黃曉明的幫助，baby演技雖然不好，但基本都是跟劉德華這類的大咖合作，但随着baby和黃曉明婚姻不和的消息傳開，雖然夫妻倆沒有任何回應，... 2022-11-07
生活祝福朋友升職的簡短
祝福朋友升職的簡短?恭喜你，祝賀你，今天比昨天好，明天比今天好，芝麻開花節節高，一天更比一天高，祝你高升，高升，再高升，今天小編就來說說關于祝福朋友升職的簡短?下面更多詳細答案一起來看看吧!祝福朋友升職的簡短恭喜你，祝賀你，今天比昨天好，明... 2022-06-13
生活如何補救毛衣領子
又到了穿毛衣的季節不過毛衣穿久了領口很容易變形今天教你幾招讓毛衣煥然一新！領口變松用這個小方法毛衣輕松複原成新買的模樣！用針線在領口縫上一圈不用擔心會留下痕迹針線比毛衣的織線細多啦然後把線拉一下領口收緊如果家裡有挂燙機就用挂燙機在收縮的領口... 2022-11-12
生活獅子座叫我閉嘴什麼意思
獅子座叫我閉嘴什麼意思?他可能單純讓你閉嘴，也可能正在氣頭上，不過問題都不大，我來為大家科普一下關于獅子座叫我閉嘴什麼意思?以下内容希望對你有幫助!獅子座叫我閉嘴什麼意思他可能單純讓你閉嘴，也可能正在氣頭上，不過問題都不大。問題大在，友情裡... 2022-06-13
生活發财樹是在室内養還是在室外養
發财樹是一款非常受人們喜歡的植物，它枝幹古樸蒼勁、葉片挺拔翠綠，擺放在客廳、書房、辦公室給人以高雅大氣之感，發财樹還有着招财進寶，财源廣進等美好的寓意。對發财樹有一定了解的花友們都知道，發财樹是一款不耐寒的植物，所以想讓它順利越冬，那麼我們... 2023-02-08
生活紅了櫻桃綠了芭蕉什麼意思
紅了櫻桃綠了芭蕉什麼意思?意思是:櫻桃才紅熟,芭蕉又綠了作者從不同的角度,抓住櫻桃成熟時顔色變紅,芭蕉葉子由淺綠變為深綠這一特征,把看不見的時光流逝轉化為可以捉摸的形象抒發對年華消逝的慨歎這種轉眼間又春去夏來的感歎,包含了他對久客的歎息,包... 2022-07-07
生活三十而已顧佳為什麼不讓許幻山吃飯
三十而已顧佳為什麼不讓許幻山吃飯?《三十而已》顧佳不讓許幻山吃飯的原因是因為許幻山有脂肪肝，我來為大家科普一下關于三十而已顧佳為什麼不讓許幻山吃飯?下面希望有你要的答案，我們一起來看看吧!三十而已顧佳為什麼不讓許幻山吃飯《三十而已》顧佳不讓... 2022-06-20
生活寓意火的名字女孩名字
寓意火的名字女孩名字?煥瑤：煥字姓名學筆畫13畫，五行屬火，有光明、光亮的意思，在女寶寶名字中寓意吉祥健康、開朗樂觀；瑤字五行屬火，姓名學筆畫15畫，是美玉的意思，經常用來比喻美好、珍貴，在人名中表示活潑、美麗，接下來我們就來聊聊關于寓意火... 2022-06-09
生活白菜幹怎麼做
白菜幹怎麼做?自家種的，洗幹淨，不要掰開洗水燒開挨個放進去燙，不用一次性都放進去，沒那麼大鍋大白菜真的很大，一次燙個兩三顆，不用完全燙到熟，葉子莖變軟就可以撈出來了，下面我們就來說一說關于白菜幹怎麼做?我們一起去了解并探讨一下這個問題吧!白... 2022-08-05
生活獨特文藝好聽的微信名
獨特文藝好聽的微信名?一朝山水歲月成滄海，今天小編就來聊一聊關于獨特文藝好聽的微信名?接下來我們就一起去研究一下吧!獨特文藝好聽的微信名一朝山水歲月成滄海謝卻荼蘼青衫溫文清風不還家半醉亱未央當木當栖隐世窺紅塵獨留清風醉袖手盡入懷笑春風一杯清... 2022-07-20
生活法國商标申請需要多長時間
法國是一個高度發達的資本主義國家，歐洲四大經濟體之一，是僅次于美國的世界第二大農産品出口國。同時，法國也是世界貿易大國，外貿進出口總額排名第五，出口商品主要有機械、汽車、化工産品、鋼鐵、農産品、食品、服裝、化妝品等。圖｜源于愛設計一：注冊法... 2022-12-07
生活拂過是什麼意思
拂過是什麼意思?拂過是一個漢語詞語，讀音biguò，意思是輔助君主糾正過失，接下來我們就來聊聊關于拂過是什麼意思?以下内容大家不妨參考一二希望能幫到您!拂過是什麼意思拂過是一個漢語詞語，讀音biguò，意思是輔助君主糾正過失。出處：漢·賈誼... 2022-06-23
生活畫眉怎麼區分好壞
如何去挑選一個惡将，是畫眉新老玩家們，有史以來熱論時間較久的話題，也成為各地各級互相交流的主題。畫眉的體征長相都大緻一樣，有經驗的玩家看得比較細膩，其實很多地方都不一樣。如何選出将級呢？原則就是：毛眼為先，品相為上。把畫眉身上的條件當作一輛... 2022-11-06
生活哪些人可以吃人參
哪些人可以吃人參?腫瘤患者适合吃人參人參中的主要有效成分就是人參皂苷，這是一種人參特有的活性物質，能夠有效抑制腫瘤細胞的增殖和擴散，腫瘤患者适當食用人參，能夠充分利用其中的人參皂苷，從而起到控制病情的作用，接下來我們就來聊聊關于哪些人可以吃... 2022-06-15
生活聖誕禮物送什麼好
聖誕禮物送什麼好?珠寶飾品一款精緻雪花的項鍊，或者還是一枚雪花款的鑽戒，氣質滿分的同時，也帶有着聖誕節濃濃的氣氛，我來為大家科普一下關于聖誕禮物送什麼好?下面希望有你要的答案，我們一起來看看吧!聖誕禮物送什麼好珠寶飾品。一款精緻雪花的項鍊，... 2022-06-13
生活怎麼才能把魔方還原六面
破解攻略和大家分享下：首先，破解魔方，我們就要先了解它的結構，魔方共6色6面，每面又分為中央塊（最中間的塊6個）、角塊（4角的塊8個）和邊塊（4條邊中間的塊12個）。其中中央塊隻有1個面，他們是固定的結構，所以中央是紅色的塊，那麼其他的紅色... 2022-11-29
生活作文題目如何拟定出彩
作文題目如何拟定出彩?比喻式利用比喻是使題目生動形象的好方法如《信念是飛翔的翅膀》、《生活不妨喝點苦酒》、《幸運是汗水的紅利》等都是用比喻手法拟出的好标題，今天小編就來聊一聊關于作文題目如何拟定出彩?接下來我們就一起去研究一下吧!作文題目如... 2022-06-19
生活最新版英文名字大全酒
最新版英文名字大全酒?伏特加Vodka雪莉Sherry，我來為大家講解一下關于最新版英文名字大全酒?跟着小編一起來看一看吧!最新版英文名字大全酒伏特加Vodka雪莉Sherry龍舌蘭Tequila匹斯可Pisco卡爾瓦多斯Calvados基... 2022-07-18
生活亂花漸欲迷人眼莫待無花空折枝
說話要用腦子，敏事慎言，話多無益，嘴隻是一件揚聲器而已，平時一定要注意監督、控制好調頻旋鈕和音控開關，否則會給自己帶來許多麻煩。講話不要信口開河，以為人家給你笑臉就是欣賞，沒完沒了的掏心窩子，結果讓人家徹底摸清了家底。還偷着笑你人生如茶，靜... 2022-11-22
生活五行缺木怎麼補
五行缺木怎麼補?分析了自己的五行關系，确認了是缺木的話，那建議選擇随身佩戴飾品方便些大多數提起補五行第一個想到的是通過改名來補，其實改名也不失為一個方法，但是就是改名之後會對你的生活出行上造成一些不便的影響，所以這裡建議你還是選擇飾品的好，... 2022-06-13

tft每日頭條

> 生活

> python爬蟲進程和線程

python爬蟲進程和線程

相关生活资讯推荐

热门生活资讯推荐

网友关注