A1 Website Scraper是一個高級Windows應(yīng)用程序,專門用于幫助您抓取網(wǎng)站并將數(shù)據(jù)提取到可自定義的CSV文件中。
軟件特點
用戶界面
默認(rèn)情況下,該工具顯示簡化的查看模式,該模式隱藏了一些高級配置設(shè)置。在兩種模式之間切換需要單擊一下。
A1網(wǎng)站抓取工具采用了多選項卡式布局,可以快速訪問該程序的幾個關(guān)鍵功能,這些功能使您可以設(shè)置抓取選項,掃描網(wǎng)站,分析網(wǎng)站和查看文件。
另外,您可以創(chuàng)建存儲所有配置數(shù)據(jù)的項目,并將其保存在計算機上,以便將來可以導(dǎo)入和編輯它們。
提取配置設(shè)置
A1網(wǎng)站抓取工具隨附許多專用參數(shù),可幫助您自定義抓取和提取數(shù)據(jù)的方式。您可以使用自定義正則表達(dá)式從抓取的頁面中獲取數(shù)據(jù)并插入各種測試示例(例如,提取產(chǎn)品名稱和URL,要提取的單個列,多個正則表達(dá)式函數(shù))。
此外,您還可以定義輸出數(shù)據(jù)格式(CSV文件格式),查看CSV測試輸出,顯示原始測試輸出,抓取整個網(wǎng)站,控制要獲取鏈接內(nèi)容分析的URL,以及應(yīng)用輸出過濾器以抓取來自某些網(wǎng)址的數(shù)據(jù)。
該應(yīng)用程序使您可以從純文本文件中導(dǎo)入URL,調(diào)整生成的CSV文件的編碼和字符格式,并使用標(biāo)題或URL導(dǎo)出CSV數(shù)據(jù)。
掃描和分析網(wǎng)站
A1 Website Scraper允許您啟動或停止掃描過程,在幾個快速預(yù)設(shè)之間進(jìn)行選擇,查看有關(guān)掃描數(shù)據(jù)的信息(例如,掃描狀態(tài),總時間,內(nèi)部和外部URL的數(shù)量,在搜尋器引擎中等待的作業(yè))以及更改幾個數(shù)據(jù)收集參數(shù),例如創(chuàng)建網(wǎng)站掃描的日志文件,驗證外部URL,存儲所有頁面的標(biāo)題)。
分析模式創(chuàng)建帶有鏈接的網(wǎng)站結(jié)構(gòu),并允許您應(yīng)用過濾器(例如,僅顯示具有重復(fù)標(biāo)題,描述和關(guān)鍵字的URL),并查看有關(guān)每個網(wǎng)頁的信息,即核心數(shù)據(jù)(例如標(biāo)題,描述,完整地址,響應(yīng)代碼) )和外部數(shù)據(jù)(例如外部和內(nèi)部鏈接)。此外,您可以預(yù)覽文件和源數(shù)據(jù)。
表格,查看模式和其他便捷工具
您可以在文本編輯器,記事本,Internet Explorer或Firefox中打開所選文件,在表中添加或刪除項目,插入行,上下移動項目,刪除HTML注釋,設(shè)置格式和去除空格,以及啟用語法突出顯示和拼寫檢查功能。
整體可靠的網(wǎng)站抓取工具
總而言之,A1網(wǎng)站抓取工具具有多種自定義功能,可用于抓取網(wǎng)站并將數(shù)據(jù)提取到CSV文件中,特別適合專業(yè)用戶。