- 軟件大小:27.09M
- 軟件語(yǔ)言:中文
- 軟件類型:國產軟件
- 軟件類別:免費(fèi)軟件(jiàn) / 下載工具
- 更新時間:2023-03-13 00:09
- 運行環境:WinAll, WinXP
- 軟件等(děng)級:
- 軟件廠商:
- 官方網站:http://www.51pashanhu.com
3.18M/中文/5.0
0KB/中文/5.0
2.98M/中文/10.0
3.41M/中文/5.0
700KB/中文/10.0
爬山虎(hǔ)采集器是(shì)一款(kuǎn)專(zhuān)為用戶提供信息采集功能的(de)軟件,用戶可以(yǐ)使用軟件將自(zì)己需要的信息數據從瀏覽器(qì)或者是其他的地方收集(jí),並生(shēng)成你想要的(de)文本格式,非常的簡單又方便,需要的用戶快來綠色資(zī)源網(wǎng)下載(zǎi)吧!
爬(pá)山虎采集器(qì)是一款支持99%的網站數據(jù)采集的高效網頁信息(xī)采集軟件(jiàn),軟件能生成excel表格,api數據庫文件等內(nèi)容,幫助你管理網站數據信息(xī),如果您需要對某個指(zhǐ)定網頁數據進(jìn)行采集,使用這款軟件即可!
腳(jiǎo)本定時運行
可按照計劃定(dìng)時(shí)運行,無需人工(gōng)
獨創高速內核
自研的瀏覽器(qì)內(nèi)核,速度飛快,遠超對手
向導(dǎo)模式
簡(jiǎn)單易用,輕(qīng)鬆通過鼠(shǔ)標點擊自動生成
智能識別
對於網頁中的列表(biǎo)、表單結構(gòu)(多選框下拉列表等)能夠智能識別
廣告屏蔽(bì)
定製的廣告屏蔽模塊(kuài),兼容adblockPlus語法,可添加(jiā)自定義規則
多種數據導出
支持Txt 、Excel、mysql、SQLServer、sqlite、access、網站等
適用(yòng)各種網站
能夠(gòu)采集互聯網(wǎng)99%的網(wǎng)站,包括(kuò)單頁應用Ajax加(jiā)載等等動態類型網站
一鍵提取(qǔ)數據(jù)
簡單易學,通過可(kě)視化界麵,鼠(shǔ)標點擊即可抓取數據
快速高效
內置一(yī)套高速瀏覽器內核,加上HTTP引擎模式,實現快速(sù)采集數據
問:如何抓包獲(huò)取Cookie,並且手動設置?
1.首先,使用穀歌瀏覽器打開要采集的網站,並且登陸(lù)。
2.然後按下 F12,會(huì)出現開發者工具,選擇 Network
3.然(rán)後按下F5,刷新下(xià)頁麵, 選擇其中一個(gè)請求。
4.複製完成後(hòu),在爬山虎采集器中,編輯任務,進入第三步(bù),指(zhǐ)定HTTP Header。
問:如何過濾列表中的前N個數據?
1.有(yǒu)時我們需要對采集到的列(liè)表(biǎo)進行過濾,比如過濾掉第(dì)一組數據(jù)(在采集表格時,過濾掉表格列名)
2.點擊列表模式菜(cài)單中的,設置列表xpath
第一步:輸入采集網址
打開軟件,新建任務,輸(shū)入需要采集的網站地址。
第二步:智能(néng)分析,全程自(zì)動化提取數據
進入到第(dì)二步後,爬(pá)山虎采(cǎi)集器(qì)全自動智能分析網頁,並且從中提取出列表(biǎo)數據。
第三步:導出數據到表格、數據庫、網(wǎng)站等
運行任(rèn)務,將采集到的數據(jù)導出為Csv、Excel以及各種數據庫,支持(chí)api導出。
1.修(xiū)複(fù)登陸(lù)時的DNS問題
2.修複圖片下載問題
3.修複 json 一些問題
4.增加插件功能
5.增加導出 txt (一條保存為一個文件)
6.多值連接符支持換行符
7.修改數據處理的文本映射(支持查找替換)
請描述您所遇到的(de)錯誤,我(wǒ)們將(jiāng)盡快予以修正,謝謝!
*必填(tián)項,請(qǐng)輸入內容(róng)