PDF Plain Text Extractor是一款PDF文本提取工具,用戶能夠使用這款軟件方便快捷的將PDF文件中的純文本進(jìn)行提取。軟件使用方便,用戶能夠快速上手軟件的使用,并且軟件支持多種語言的提取,還對(duì)處理器的運(yùn)用進(jìn)行了優(yōu)化,讓軟件能夠以更快的速度對(duì)文本進(jìn)行提取。
基本簡(jiǎn)介
PDF Plain Text Extractor是從 pdf 文件中提取文本的強(qiáng)大工具。 它不需要來自 Adobe 的任何產(chǎn)品,您不需要花費(fèi) $xxx 購買 Adobe Acrobat 只是為了將您的 pdf 文件轉(zhuǎn)換為純文本文件。
PDF Plain Text Extractor是用 C++ 編寫的,高性能和準(zhǔn)確性是我們的目標(biāo)。 處理引擎已從 3.015 升級(jí)到 4.420。 我們?cè)谶@個(gè)版本中添加的最棒的功能是多字節(jié)語言支持。 PDF 純文本提取器 4.4 支持英語、所有歐洲語言、簡(jiǎn)體中文、繁體中文、日語、韓語。 輸出采用 UTF-8 格式,核心處理器進(jìn)行了優(yōu)化以獲得更好的性能。
功能介紹
1. 它直接分析原始pdf文件,并從中提取純文本,同時(shí)保留pdf文件的版面。
2.不需要任何第三方產(chǎn)品(例如Adobe Acrobat或Adobe Acrobat Reader)。
3.支持LZW編碼的pdf文檔。
4.支持英語,法語,德語,意大利語和其他語言。
5.您可以拖放pdf文檔以完成轉(zhuǎn)換。
6.可以轉(zhuǎn)換整個(gè)文件夾(遞歸與否)。
7.一次可以轉(zhuǎn)換來自硬盤驅(qū)動(dòng)器不同位置的pdf文件。
8.可以保存轉(zhuǎn)換的pdf文件列表以備將來使用。
9.可以輸出文件的頁面范圍。
10.可以將分頁符字符串設(shè)置為單獨(dú)的頁面。
11.可以用分頁符字符串設(shè)置輸出頁碼。
12.可以通過圖形用戶界面瀏覽pdf文件的信息(標(biāo)題/作者/創(chuàng)建日期...)。
13.可以選擇將pdf文件的信息輸出到輸出文本文件。
14.可以設(shè)置單個(gè)pdf文件或轉(zhuǎn)換列表中所有pdf文件的輸出文件夾。
15.支持uni code,多字節(jié)語言。
16.支持Type0,Type1,Type3,TrueType,CIDFont字體。
軟件特色
PDF Plain Text Extractor是一款可以幫助您將“便攜式文檔格式”文件中的文本保存到單獨(dú)文檔中的軟件。
該程序的用戶界面簡(jiǎn)潔明了,易于瀏覽。因此,您可以使用文件樹視圖或“拖放”方法將文件添加到列表中(支持批量轉(zhuǎn)換)。
您可以查看文件夾中包含的每個(gè)PDF文件的名稱,大小和修改日期,以及其標(biāo)題,主題,作者,創(chuàng)建者,生產(chǎn)者,創(chuàng)建日期和關(guān)鍵字。
您可以指定輸出目標(biāo),預(yù)覽PDF(如果安裝了兼容程序),啟用輸出過程詳細(xì)信息和輸出過程時(shí)間,以及設(shè)置頁面范圍,分隔符和編號(hào)。
此外,您可以啟用PDF純文本提取器來覆蓋現(xiàn)有文件,并將輸出與源文件放置在同一文件夾中,保存轉(zhuǎn)換列表,從列表中刪除文件,等等。
該程序使用非常少的系統(tǒng)資源,并包含一個(gè)全面的幫助文件(帶有快照)。在我們的測(cè)試過程中,它沒有凍結(jié)或崩潰,并且設(shè)法提取了除英語以外的其他語言中的特殊字符。
另一方面,當(dāng)嘗試從帶有圖像或表格的PDF文件中提取文本時(shí),該軟件遇到較小的格式設(shè)置問題。
總而言之,即使是菜鳥,也可以輕松使用PDF Plain Text Extractor。強(qiáng)烈建議您使用該程序?qū)DF轉(zhuǎn)換為文本。