1,規則定義——通過收集規則的定義,妳可以搜索所有的網站來收集幾乎任何種類的信息。
2、多任務、多線程——可以同時進行多個信息采集任務,每個任務可以使用多個線程。
3.數據保存——數據在收集的同時自動保存到關系數據庫中,並且數據結構可以自動調整。該軟件可以根據收集規則自動創建數據庫以及其中的表和字段。
4.網站登錄-支持網站登錄。
5.智能網頁文本提取-文本可以智能地從網頁代碼中提取。
6.結果替換-您可以根據規則用您定義的內容替換收集的結果。
7.文件下載-收集到的二進制文件(如圖片、音樂、軟件、文檔等。)可以下載到本地磁盤或收集結果數據庫。
8.采集結果分類-采集結果可以根據用戶自定義的分類信息自動分類。
9.數據發布-收集的結果數據可以通過用戶定義的界面發布到任何內容管理系統和指定的數據庫。
10,條件過濾——可以根據某種條件決定保存哪些信息,過濾哪些信息。
11,過濾重復內容——軟件可以根據用戶設置和實際情況自動刪除重復內容和重復網站,等等。