有時候我們在用python爬取某平台數據的時候,會要求登錄後才能獲取到信息,比如某bili需要驗證文字驗證碼後,才可以進行登錄
對于這種文字驗證碼,還是比較簡單的,這裡我是使用第三方平台超級ying進行文字識别,識别出文字的坐标,在依次點擊文字坐标。下面簡單學習一下
一、登錄
通過python中selenium模塊實現自動登錄,彈出文字驗證碼框,方便我們進行截取圖片
二、獲取驗證碼圖片
通過元素坐标定位,再進行剪切,保存為圖片,這三個封裝方法就實現了驗證碼圖片的剪切保存
三、調用超級ying識别
将剪切下來的圖片,放入超級ying的第三方接口中,超級ying代碼平台會提供,我們下載下來直接用就可以了
四、移動點擊
獲取響應回來的坐标後,再用actionchains庫模拟移動點擊
五、驗證成功
自動移動點擊後,顯示驗證成功了,那麼就成功登錄頁面了。後面我們拿到登錄後cookies就可以進行下一步的數據抓取了。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!