1、名稱:又被稱為網頁蜘蛛,網絡機器人。
2、解釋:是壹種按照壹定的規則,自動地抓取萬維網信息的程序或者腳本。
3、背景:隨著網絡的迅速發展,萬維網成為大量信息的載體,如何有效地提取並利用這些信息成為壹個巨大的挑戰。
二、功能
1、 對抓取目標的描述或定義。
2、對網頁或數據的分析與過濾。
3、對網頁或數據的搜索策略。
三、分類
1、通用網絡爬蟲。
2、聚焦網絡爬蟲。
3、增量式網絡爬蟲。