pyFileSearcher被設(shè)計成一個輕量級的、易于使用的、但能夠處理大量文件的工具,個人可以在大型企業(yè)服務(wù)器上使用的工具,以找出--哪些文件在過去幾天里占用了空間,它是免費(fèi)的,它是開源的,它適用于Linux和Windows。
軟件介紹
你得到的是什么?
按名稱、大小、文件類型搜索。按路徑的一部分進(jìn)行搜索。搜索索引中列出的不早于N天的文件
保存已刪除文件的信息,對它們的搜索和對普通文件的搜索一樣
能夠保存搜索設(shè)置供將來使用
能夠以csv格式保存搜索結(jié)果
在搜索結(jié)果中突出顯示不存在的(已刪除的)文件
記錄訪問錯誤--你將知道哪些文件夾由于某種原因沒有被索引到
支持Windows中的長路徑(>256個字符)。
它是如何工作的
該程序在你的硬盤上運(yùn)行,并保存關(guān)于文件的最低限度的必要信息:大小、創(chuàng)建時間、修改時間和文件的第一次索引時間(便于在不看屬性的情況下尋找新文件)。為了存儲這些信息,你可以使用sqlite數(shù)據(jù)庫(每個你想索引的目標(biāo)目錄都有一個),如果你想索引幾十萬和幾百萬個文件,也可以使用MySQL數(shù)據(jù)庫。在后一種情況下,你可以只使用一個數(shù)據(jù)庫,但指定幾個目標(biāo)目錄。在這兩種情況下,每個目標(biāo)目錄都是與其他目錄并行索引的。
在你設(shè)置了簡單的索引參數(shù)(目標(biāo)目錄,以及在使用sqlite的情況下,擴(kuò)展名的白名單或黑名單)之后,你可以用"--scan "參數(shù)運(yùn)行程序,自動開始索引,之后程序?qū)⒈魂P(guān)閉。使用這個鍵可以通過調(diào)度程序運(yùn)行。
在掃描過程中,在工作("data")目錄中會創(chuàng)建一個pid文件。它的存在會阻止啟動掃描的過程,如果程序崩潰了--請手動刪除它。
測試
該程序在一個有大約2000萬個文件的文件服務(wù)器上進(jìn)行了測試。掃描時間 - 約5小時。最大線程中的文件:~7000000
MySQL的非默認(rèn)參數(shù)(對于debian stretch)。
innodb_buffer_pool_size = 3000M
innodb_log_file_size = 128M
innodb_log_buffer_size = 4M
innodb_flush_method = O_DIRECT