集搜客GooSeeker采集規則圖文教學
時間:2021-05-23 12:09:30 作者:無名 瀏覽量:54
集搜客GooSeeker是一款功能非常強大的網頁數
采集工具,能夠幫助用戶輕松采集網頁中的超鏈接,表格,圖片信息,文字內容等等,致力于將互聯網中的所有內容轉化為
數據庫和表格,界面簡潔,功能列表信息排布,大大方便了用戶的使用,用戶可以對網頁內容的結構進行轉換,并且對收集到的內容進行標注用戶可以自定義采集規則,幫助大家能夠從更廣的角度和深度去采取網頁數據。
使用幫助
第一步:打開網頁
1.1, 加載網頁,看到要采集的內容
打開數據管家用戶需要輸入網址,并點擊鍵盤中的回車按鈕,等待王者加載完成之后,用戶請查看當前的網頁內容是否完整,用戶如果需要采集網頁下方的各種內容,就需要哪種網頁側邊的滾動條,讓網頁能夠得到充分的加載,然后才可以創建新的采集任務。
1.2 ,創建采集任務
用戶如果需要創建新的采集任務,只需要在頁面的左上角點擊添加按鈕,也就是加號,然后在彈出的菜單欄中輸入當前采集的任務名稱,任務名稱是唯一的,如果有相同的財經,明天就需要進行更改,直到能夠為系統接受為止。
第二步:標注需要采集的信息
2.1,在網頁上做標注
用戶如果需要采集當前網頁第一個商品的標題信息,就使用
鼠標點擊標題,然后雙擊在彈出的菜單欄窗口中輸入內容編輯一個字段名稱,對應到
Excel中的字段,輸入商品標題,創建輸出Excel表格,填寫表格名稱。
集搜客GooSeeker采集規則圖文教學圖2
2.2,標注更多內容
接下來用戶需要重復上一個操作步驟來填寫店鋪名稱評論數量以及標注的價格信息。
第三步:保存規則,采數據
3.1,測試采集是否符合預期
點擊“測試”按鈕,檢查信息完整性。很有可能采集到的內容是空的,或者是包含了很多不需要的內容,或者錯位了,采集到了相鄰的內容。那么就需要重新調整映射關系,如果直觀標注不精確,可以去下面的DOM窗口做內容映射。
集搜客GooSeeker采集規則圖文教學圖3
3.2,點擊“保存”
只有保存了規則,爬蟲才能執行規則,采集數據。未來還可以修改規則。
集搜客GooSeeker采集規則圖文教學圖4
- 軟件性質:國產軟件
- 授權方式:免費版
- 軟件語言:簡體中文
- 軟件大。30931 KB
- 下載次數:314 次
- 更新時間:2021/5/16 10:49:09
- 運行平臺:WinAll...
- 軟件描述:集搜客GooSeeker是一款功能齊全的網頁數據采集軟件,你可以把它看成一條網絡... [立即下載]
相關資訊
相關軟件