您的位置:極速下載站 → 電腦軟件 → 網(wǎng)絡(luò)軟件 → 網(wǎng)絡(luò)其他 → 網(wǎng)絡(luò)神采
采集過網(wǎng)頁數(shù)據(jù)的用戶都知道,要配規(guī)則,錯(cuò)一個(gè)符號(hào)和錯(cuò)一個(gè)字母都匹配失敗無法采集。今天極速小編為你介紹一款全新的網(wǎng)頁數(shù)據(jù)采集工具(網(wǎng)絡(luò)神采),它可以采集任意網(wǎng)頁上的數(shù)據(jù),采用智能采集模式,不用匹配規(guī)則,還支持二次開發(fā),需要的網(wǎng)友可以下載使用。
登陸界面

神采主界面

基本簡(jiǎn)介
《網(wǎng)絡(luò)神采》是一款輕量級(jí)的采集軟件,用于快速采集、下載網(wǎng)頁數(shù)據(jù)。軟件速度快、好用、免費(fèi)。支持智能采集(不用配規(guī)則)、可視化采集(不用看源文件),支持二次開發(fā)、分布式部署。為用戶的大數(shù)據(jù)分析、信息化平臺(tái),提供穩(wěn)定、持續(xù)、準(zhǔn)確的數(shù)據(jù)資源。
功能介紹
1、采集強(qiáng)度
支持JS解析、POST分頁、登錄采集、跨層采集。對(duì)于疑難采集頁面,有成熟的解決方案。
2、速度快
支持多任務(wù)同時(shí)運(yùn)行,每個(gè)任務(wù)又可以設(shè)置多線程,確保運(yùn)行效率。
3、規(guī)模化
支持任務(wù)多級(jí)分類、批量管理。支持云服務(wù)器分布式部署,管理員團(tuán)隊(duì)協(xié)合。
4、流程化
支持定時(shí)采集,任務(wù)定時(shí)自動(dòng)啟動(dòng)。通過二次開發(fā),實(shí)現(xiàn)流程化的信息采集、信息處理。
5、運(yùn)行穩(wěn)定
系統(tǒng)運(yùn)行穩(wěn)定,要求“0 bug”。目標(biāo)網(wǎng)頁改版后,自動(dòng)通知管理員。
6、準(zhǔn)確性
定制好任務(wù)后,采集準(zhǔn)確率可達(dá)100%,即一條不漏。
神采在線發(fā)布器

神采正則式測(cè)試器

神采網(wǎng)址編碼器

更新日志
1、增加定期重啟軟件功能。
2、修復(fù)bug:定時(shí)采集啟動(dòng)任務(wù)時(shí)會(huì)進(jìn)隊(duì)列2次。
3、增加設(shè)置:特殊結(jié)果設(shè)置 -> 記錄任務(wù)名稱。
4、修復(fù)bug:Win7下啟動(dòng)服務(wù)IO異常。
5、按任務(wù)統(tǒng)計(jì)插件。
6、修復(fù)bug:文本查看器切換到空白單元格會(huì)出錯(cuò)。
7、如果不下載文件,不要再生成子目錄(即使選中設(shè)置)。
8、F9運(yùn)行文件夾下所有任務(wù)后,子文件夾的任務(wù)狀態(tài)沒有改變。
9、修復(fù)bug:訪問休息間隔設(shè)置為“0-1秒”時(shí)失效。
10、處理JS中的相對(duì)地址時(shí),可識(shí)別“'”前面的轉(zhuǎn)義符“\”。
11、發(fā)生 Worker Thread Error 的異常時(shí),可記錄異常的詳細(xì)內(nèi)容。
12、讀取網(wǎng)址時(shí)出錯(cuò)后,可暫停任務(wù)。
13、發(fā)生 Worker Thread Error 的異常時(shí),任務(wù)可暫停;若暫停失敗,則停止任務(wù)。
14、修復(fù)bug:繼續(xù)任務(wù)時(shí),如果任務(wù)進(jìn)入任務(wù)隊(duì)列,則會(huì)重新開始任務(wù)。
15、停止任務(wù),同樣要寫日志。
16、改進(jìn)了任務(wù)隊(duì)列的查詢算法。
17、改進(jìn)了機(jī)器碼的可讀性。
18、Worker Thread Error: 引發(fā)類型為“System.OutOfMemoryException”的異常。該異常發(fā)生后,可暫停任務(wù)。
19、保存“提取網(wǎng)址”時(shí)如果出錯(cuò),可恢復(fù)。
20、增加設(shè)置:如果“使用插件處理采集結(jié)果數(shù)據(jù)行”失敗(即返回“false”),仍顯示采集結(jié)果。
21、廢棄設(shè)置:關(guān)閉軟件時(shí),如果有軟件正在運(yùn)行,強(qiáng)制停止所有任務(wù)。
22、改進(jìn)“源文件查看器”用戶體驗(yàn)3處:Cookie變化、粘貼POST參數(shù)時(shí)自動(dòng)分離、菜單快捷鍵。
23、捕獲地址時(shí),如果某個(gè)參數(shù)有變化,文本框背景色則變紅。
24、將檢查“關(guān)鍵規(guī)則”調(diào)整到“采集結(jié)果篩選”之前。
25、更新插件接口(IBget 3.4),更新內(nèi)容:CheckSchedule、Create 新增參數(shù):lastTaskState、lastPausingReason。
26、請(qǐng)求休息間隔,支持隨機(jī)數(shù)。
27、請(qǐng)求重試可以設(shè)置為無限次數(shù),同時(shí)增加“重試休息間隔”、“重試錯(cuò)誤范圍”設(shè)置。
28、任務(wù)增加設(shè)置:動(dòng)作失敗后不暫停任務(wù)。
29、下載文件時(shí),只請(qǐng)求一次。
30、運(yùn)行整個(gè)文件夾的任務(wù)時(shí),增加快捷鍵:F9。
31、修復(fù)bug:批量暫停正在啟動(dòng)的任務(wù)時(shí),會(huì)有“運(yùn)行中”狀態(tài)閃過。
32、解決:運(yùn)行信息窗口資源釋放問題。
33、使用插件處理結(jié)果數(shù)據(jù)行后,如果返回false,則數(shù)據(jù)行不再顯示。
34、循環(huán)采集拆分字符串?dāng)?shù)組時(shí),保留空值。
35、修復(fù)內(nèi)存bug一處。
36、修復(fù)bug:查看等待區(qū)出錯(cuò):集合已修改;可能無法執(zhí)行枚舉操作。
37、修復(fù)bug:由于插件日志回調(diào)事件,會(huì)引發(fā)異常:遠(yuǎn)程對(duì)象已斷開。
38、修復(fù)bug:設(shè)置窗口如果不操作,2分鐘后會(huì)拋異常:遠(yuǎn)程對(duì)象已斷開。
39、更新插件接口(IBget 3.3),更新內(nèi)容:ExtractResult 新增參數(shù):rowIndex;Create 新增參數(shù):supportAsyncCall。
40、創(chuàng)建插件時(shí)如果出錯(cuò),任務(wù)不再提示連接數(shù)據(jù)庫。
41、特殊結(jié)果 -》 記錄當(dāng)前網(wǎng)址,如果有POST參數(shù),則包含在其中。
42、修復(fù)bug:任務(wù)完成后取消定時(shí)采集,在選中“使用插件檢查定時(shí)采集”時(shí)仍起作用。
43、修復(fù)bug:源文件查看器預(yù)覽功能,不能預(yù)覽框架頁。
44、增加復(fù)制采集規(guī)則功能。
45、提取下一網(wǎng)址時(shí),如果與網(wǎng)址隊(duì)列重復(fù),則提示:提取 n 條,已去重.
46、連續(xù)提取下一層網(wǎng)址失敗已達(dá)到 n 次后,不再提取下一頁網(wǎng)址,不然下次請(qǐng)求時(shí)會(huì)重復(fù)提取。
47、修復(fù)幾處內(nèi)存溢出問題。
48、修復(fù)bug:文本查看器 html 方式查看,關(guān)閉窗口后,再打開出錯(cuò)“未將對(duì)象引用設(shè)置到實(shí)例”。
49、改進(jìn)定時(shí)采集檢查思路:取當(dāng)前時(shí)間并緩存,這樣就沒有了定時(shí)偏差。
文件信息
文件大小:1511424 字節(jié)
文件說明:網(wǎng)絡(luò)神采 6.2.16 共享版
文件版本:6.2.16.26114
MD5:FD84A690A093DE84F16C623FD9A77CE3
SHA1:8C7394436EC9B31B635AB0024FFBC91CE03115A6
CRC32:2F2B1941
包含文件
bget.exe
htmlview.exe
poster.exe
RegexTester.exe
Updater.exe
官方網(wǎng)站:http://www.sensite.cn/
相關(guān)搜索:采集
網(wǎng)絡(luò)神采是一款好用的網(wǎng)頁信息采集軟件。使用網(wǎng)絡(luò)神采可以輕松選擇網(wǎng)站中的網(wǎng)站信息進(jìn)行采集;

極速小編這一次就給大家演示一下怎么使用網(wǎng)絡(luò)神采來采集58同城中的租房信息吧。點(diǎn)擊選中網(wǎng)絡(luò)神采主界面中的任務(wù)列表中的58同城-租房,然后點(diǎn)擊軟軟件工具欄中的運(yùn)行按鈕,開始執(zhí)行采集58同城租房網(wǎng)頁信息;

網(wǎng)絡(luò)神采正在采集58同城上面的租房信息。目前網(wǎng)絡(luò)神采已經(jīng)提取了32個(gè)網(wǎng)址,完成提取6個(gè)網(wǎng)址。當(dāng)前采集了5個(gè)網(wǎng)頁,采集結(jié)果為464個(gè)網(wǎng)頁;

網(wǎng)頁信息采集成功,這時(shí)候我們可以看到網(wǎng)絡(luò)神采提示已完成。58同城-租房的采集任務(wù)完成提取64個(gè)網(wǎng)址,從522個(gè)結(jié)果中采集了63個(gè)結(jié)果;

接下來我們就可以將采集結(jié)果導(dǎo)出到電腦文件夾中。點(diǎn)擊網(wǎng)絡(luò)神采任務(wù)列表中的任務(wù),然后點(diǎn)擊右鍵菜單中的導(dǎo)出,就可以將網(wǎng)頁采集任務(wù)導(dǎo)出到電腦中;

在文件另存為窗口中,點(diǎn)擊打開想要用來保存采集結(jié)果XML文件的文件夾。網(wǎng)絡(luò)神采會(huì)自動(dòng)對(duì)XML文檔進(jìn)行命名,點(diǎn)擊保存就可以將XML文件保存到選中的文件夾中;

XML文檔成功保存到指定的文件夾中,我們可以雙擊打開XML文檔,查看網(wǎng)絡(luò)神采的網(wǎng)頁采集結(jié)果;

注:您的評(píng)論需要經(jīng)過審核才能顯示,請(qǐng)文明發(fā)言!