Duplicate Cleaner——windows下最专业的重复文件查找器 » 荒野无灯weblog

Keep It Simple, Stupid.

荒野无灯weblog

Duplicate Cleaner——windows下最专业的重复文件查找器

今天要给大家分享的是windows下一个非常专业的重复文件查找、清理类的软件。为方便英文不好的童鞋,我已义务做了一份简体中文语言文件并提交到了官方,官方表示在下一个版本更新中,会将我这个简体中文语言文件同时加入收费版和免费版中。 做翻译的事情其实很无聊的,并且,你还要对这个软件的每个菜单 ,每一个选项都要熟悉。确保不会因为你的翻译而误导别人。 我个人其实倾向于使用英文原版的软件的。这里的翻译是我自愿的。我只是觉得这个软件用起来很舒服,做得很专业,是个不可多得的好软件。因此,这里也发文章与大家分享一下。最后,翻译如有不当之处,请大家多多指教。

Duplicate Cleaner 官方网站: http://www.digitalvolcano.co.uk/duplicatecleaner.html

简体中文语言文件下载: http://www.digitalvolcano.co.uk/board/viewtopic.php?f=12&t=1173

windows下专业的重复文件查找器很多,目前我觉得做得比较好的有下面几个: Duplicate Cleaner easy duplicate finder Duplicate File Detective

其它两个我也都试用过一下。但是总觉得没有Duplicate Cleaner用起来顺手。 其中Duplicate File Detective 4 ,我在一次测试时,给定一个有重复文件的目录给它扫描,居然显示什么也没扫到。无奈只好卸载之。 Duplicate File Detective 4我比较看好它的功能是文件hash缓存功能,缓存的好处是如果在短时间内你需要重复扫描这些文件,可以不必要重复计算hash. 一些文件管理器,如Total Command 、Direcotry Opus等,也具有重复文件查找功能。还有一些软件,如TuneUp 、Revo Uninstaller Pro、Auslogics BoostSpeed和Glary Utilities等,也都附带重复文件查找功能。不过,这里讨论的是“专业”的重复文件查找器。 如果你只需要简单地重复文件查找功能,那么以上程序自带的功能估计也就够你用了。

价格比较

pro版价格: Duplicate Cleaner $29.95 【有免费版提供】 easy duplicate finder $39.95
Duplicate File Detective v4 Single-User License $28.00

这里只有Duplicate Cleaner是提供免费版本的。免费版本的功能也非常强大。收费版与免费版的区别是,免费版的可以按照特定条件搜索一些特定格式的文件,如音频、图片等。

中文支持情况

目前只有easy duplicate finder官方版本中有中文语言。不过Duplicate Cleaner的下一个版本马上就会有了。前面我抽时间给Duplicate Cleaner做了一个中文语言文件,以方便英文不好的童鞋。 具体可以去官方论坛看:http://www.digitalvolcano.co.uk/board/viewtopic.php?f=12&t=1173 同时,我向作者反馈了下,问他有没有向中国地区的用户推出优惠价格的想法,作者表示会考虑这个。 以下为作者给我的回复:

by DigitalVolcano » Fri May 24, 2013 10:35 am

Thank you for this! This looks very good. I shall add it to the next update of Duplicate Cleaner (both versions).

We will also look into adjusting the pricing for China - I know other companies do this with larger software products (eg AutoCAD).

=================================================================

常规文件查找算法比较

easy duplicate finder CRC32 checksum + FileSize Byte-by-Byte Comparison Filename

Duplicate Cleaner:

Match by Content (Byte-by-Byte, MD5 Hash, SHA-1 Hash, SHA-256 Hash methods) SHA-256 SHA-1 MD5 Byte-to-Byte Filename (same / similar ) Match by similar content (%) Match by File Name Match by File Date Created Match by File Date Modifed Match by File Size

Duplicate File Detective : CRC32 (32bits) ADLER32 (32bits) SHA1 (160bits) SHA256 (256bits) SHA512 (512bits)

可以看到,除了Duplicate File Detective ,另外两个软件都提供Byte-to-Byte 查找重复文件的方式,这是最慢的算法,但是应该是最靠谱的算法。因此,在这一点上,Duplicate File Detective 似乎对它的hash算法比较自信。不过目前没有任何证据表明,这几个hash算法计算出的东西,只要它们的hash相同,那么内容一定完全相同。因此,如果你要100%保险,那么还是选择Byte-to-Byte 方式吧。

易用性

在界面上,Duplicate Cleaner 和easy duplicate finder 都比较类似。不过Duplicate Cleaner 采用标签式设计,使用起来更加方便。 首先要确定的是搜索规则,即你需要找哪些文件,怎么认定它们是重复的。 从下图,可以看到在常规模式中,可以有很多查找规则,比如,你可以指定相同内容的文件是你要查找的。或者,你只需要查找相同或者相似文件名的文件。甚至可以指定创建或修改日期。或者,你可以指定文件的相似度来扫描。 在文件过滤器中,你可以包含或者排除一些文件,可以限制你要搜索的文件的大小。

对于专业版的,你还可以使用图片模式和音频模式来扫描你的重复文件: 如程序可以按相似度来搜索图片,或者查找旋转过或翻转过的图片(这里旋转过的意思是,如果有一张图片,你用图片处理软件将它旋转了一下,如顺时针旋转了90度,那么,程序依然可以帮你找到这类重复文件)。

然后是音频模式了,这里可以根据音频标签(如IDv3标签等)来查找重复文件:

在选项中,你可以设置“相同内容”的文件依据什么方式来进行比较,如果你倾向于比较保守一点的方式,那么可以选择Byte-to-Byte 方式的比较。其次,你还可以选择md5、sha1、sha256 和 sha512 等散列算法来比较文件。Byte-to-Byte 方式是每个文件按一字节一字节地比较。而散列算法的方式是先计算文件的散列,然后把散列相同的文件认定为是重复的。对于图片文件,你还可以开启图片指标缓存。这里的图片指标(image metrics )是image science 领域的一个专业术语。Duplicate Cleaner甚至支持扫描zip文件中的重复文件(处理方式是:把zip文件当作一个目录来处理),在选项中,你可以设定用于Zip文件的临时空间最大是多少:

好了,规则设定好了,然后就是选择扫描的目录了:

这里解释下那个“扫描自身”。什么叫扫描自身呢?就是对于给定的一个需要扫描的目录,需要扫描这个文件下的文件。 而相反的,“不扫描自身”,则表示,认定这个目录下面的文件没有重复的。也就是说,我只需要扫描这个目录下面的文件,在别的目录中有没有对应的重复文件存在。

好了,规则和目录都设置好了,现在可以点击 “开始扫描”了。 扫描完了之后,在“重复文件”标签页,你可以看到所有“重复组”。因为重复的文件,肯定是两个以上的。因此,这里命名为“组”。 同一个组中的文件,都被认为是“重复”的。

这里要说下,重复文件要找到其实并不难。有很多软件都有这个功能。这里,Duplicate Cleaner的文件选择助手就大显身手了。 文件选取助手主要是用于标记(mark)需要删除或移动的文件。

对于所有重复组,你可以统一选择标记文件大小较小的文件为删除,也可以按日期、文件路径长度等来选择。 你还可以按文件位置(路径)或按文本模式来选择。

按文件位置(路径):

按文本模式选择:

按文本模式选择是比较灵活的一个方式。列名那里,你可以选择文件名、路径、组ID、创建日期、修改日期 。对于音频或图片,还有特定的 列可以选择。 对于音频文件,你甚至可以选择:保留比特率最高的、保留采样率最高的 或保留时长最长的。如下图:我选择的是保留比特率最高的:

说了这么多,可能你已经大概了解到了Duplicate Cleaner的文件选取助手的强大功能了。不过,要体会到它的强大功能,你最好自己实践一下。

好了,对于标记的文件要怎么处理呢?现在你可以点顶部那个大的”删除“按钮了,然后会弹出如下对话框:

可以选择的操作方式有很多,如删除、移动、复制、重命名、创建硬链接等。

如果你现在不想处理,可以直接点击关闭。然后在顶部选择保存profile (配置). 下次打开软件,你可以选择载入配置,再进行处理。

最后,敬告各位,请执行任何对文件的删除操作时确认那是你所需要操作,本人不对因为阅读了本文而使用本软件而造成的任何数据丢失负责。但我在这里可以保证的是,我这里介绍的一些东西,是根据我的一些使用经验来记录的,并且,我很乐意在这里与大家一起分享。 我愿意结交一些软件爱好者(伸手党除外),一起分享一些优秀的软件。

windows平台下的其它一些重复文件查找工具: http://www.duplicatefileremover.com/ http://www.bigbangenterprises.de/en/doublekillerpro/comp.htm (好久没有更新了)

开源: http://sourceforge.net/projects/yadfr/ http://sourceforge.net/projects/doubles/

免费: Duplicate Cleaner Free http://www.bigbangenterprises.de/en/doublekiller/ http://www.nirsoft.net/articles/find_duplicate_files.html

--EOF--

Tagged in :

All Comments (0)
Gravatar image
No Comments