使用 Geeqie 工具找出相似图像文件

现在的硬盘容量是越来越大,出于备份的考虑,很多朋友会采取“宁滥勿缺”的原则保存图片,这就可能出现文件重复的情况,造成文件搜索的效率低下。要在海量的存储空间中找出重复的文档,并不是一件容易的工作。其实借助著名的图像浏览工具 Geeqie 可以很轻松地找出系统中的重复和相似图像文件。这些文件相比文本文件更大,时间长了会占用很多硬盘空间。使用上面介绍的 fdupes 工具就不行,因为 fdupes 工具只能删除完全相同 (md5sum 相同) 的重复文件, 但若要剔除 "相似" 的图片文件, 则可使用 geeqie 工具。首先安装这个工具:

  1. # apt-get install gqview 

下面运行这个工具,在要搜索的目录上按鼠标右键, 选择 "Find duplicates recursive..."见图 1 。

图 1.选择 "Find duplicates recursive..."

选择左下角的 "Compare by:" 下拉菜单可选择比对方式 Similarity (custom)找出相似度 99% 以上的图片,另外可以勾选 "Thumbnails" 可显示缩略图见图 2:

图 2.找出相似度 99% 以上的图片

下面在被选取的项目上按鼠标右键, 点选 "Delete" 即可删除所有被选取的图片, 删除前会有一个的确认界面以免误删。说明 99%是图片相似度的缺省值,用户可以通过如下方式修改参数:在 Edit → Preferences → Preferences... → Behavior → Miscellaneous: Custom similarity threshold 见图 3 。

图 3.修改参数


相关内容