網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模拟程序或者蠕蟲。
其實通俗的講就是通過程序去獲取web頁面上自己想要的數據,也就是自動抓取數據。
爬蟲的定義是:網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模拟程序或者蠕蟲。
說的簡單一些,爬蟲就是模拟客戶端(浏覽器)發送網絡請求,獲取網絡響應,并按照一定的規則提取數據保存數據的程序。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!