DiDú爬蟲是一款數(shù)據(jù)采集擴(kuò)展,強(qiáng)大的爬蟲能力,能夠幫助用戶抓取需要的信息,采集好數(shù)據(jù),簡單操作,就可以滿足采集數(shù)據(jù)的需求,方便快捷。
基本簡介
DiDú專業(yè)數(shù)據(jù)采集軟件,是一款DiDú專業(yè)數(shù)據(jù)采集軟件,是一款Edge瀏覽器擴(kuò)展插件。其以輕巧敏捷的代碼,塑造強(qiáng)大的爬蟲能力,只需要一臺(tái)安裝Edge瀏覽器的電腦,即可采集各種頁面上您所需的信息。與其他爬蟲軟件設(shè)計(jì)理念不同的,它不僅可以分析頁面原始的HTML代碼,而且還支持動(dòng)態(tài)加載的DOM元素,按照您預(yù)先設(shè)計(jì)的定義切分組合這些網(wǎng)頁上的數(shù)據(jù),并儲(chǔ)存到您的本地,最后導(dǎo)出成常見的Excel數(shù)據(jù)格式。瀏覽器擴(kuò)展插件。其以輕巧敏捷的代碼,塑造強(qiáng)大的爬蟲能力,只需要一臺(tái)安裝Edge瀏覽器的電腦,即可采集各種頁面上您所需的信息。與其他爬蟲軟件設(shè)計(jì)理念不同的,它不僅可以分析頁面原始的HTML代碼,而且還支持動(dòng)態(tài)加載的DOM元素,按照您預(yù)先設(shè)計(jì)的定義切分組合這些網(wǎng)頁上的數(shù)據(jù),并儲(chǔ)存到您的本地,最后導(dǎo)出成常見的Excel數(shù)據(jù)格式。
使用方法
1、整體流程如為:編輯規(guī)則 → 測(cè)試規(guī)則 → 編輯任務(wù) → 執(zhí)行采集 → 導(dǎo)出數(shù)據(jù)
2、您需要花幾分鐘創(chuàng)建一個(gè)采集規(guī)則,或者花幾秒鐘導(dǎo)入一個(gè)采集規(guī)則。
3、在正式采集之前,建議您先進(jìn)行測(cè)試,以檢查所設(shè)定的規(guī)則字段是否正常采集。若需要自動(dòng)翻頁的,還需要測(cè)試一下能否正常翻頁。測(cè)試無誤后,就可以開始進(jìn)行您的數(shù)據(jù)采集工作了。
4、如果您希望它能夠每天定時(shí)自動(dòng)的進(jìn)行數(shù)據(jù)采集,您就需要花30秒鐘定義一個(gè)計(jì)劃任務(wù),然后綁定某個(gè)采集規(guī)則。最后打開任務(wù)調(diào)度頁面,花1秒鐘啟用任務(wù)調(diào)度開關(guān),就可以坐等數(shù)據(jù)的自動(dòng)采集。