首页 / 知识
python如何判断文件夹内的重复图片
2023-11-12 12:56:00
python如何判断文件夹内的重复图片
步骤
1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。
2、重复图片很有可能连续出现(因为重复图片大小相同)
如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。
如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。
实例
if__name__=='__main__':
load_path='E:\\测试图片集(未去重)'#要去重的文件夹
save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片
os.makedirs(save_path,exist_ok=True)
#获取图片列表file_map,字典{文件路径filename:文件大小image_size}
file_map={}
image_size=0
#遍历filePath下的文件、文件夹(包括子目录)
forparent,dirnames,filenamesinos.walk(load_path):
#fordirnameindirnames:
#print('parentis%s,dirnameis%s'%(parent,dirname))
forfilenameinfilenames:
#print('parentis%s,filenameis%s'%(parent,filename))
#print('thefullnameofthefileis%s'%os.path.join(parent,filename))
image_size=os.path.getsize(os.path.join(parent,filename))
file_map.setdefault(os.path.join(parent,filename),image_size)
#获取的图片列表按文件大小image_size排序
file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)
file_list=[]
forfilename,image_sizeinfile_map:
file_list.append(filename)
#取出重复的图片
file_repeat=[]
forcurrIndex,filenameinenumerate(file_list):
dir_image1=file_list[currIndex]
dir_image2=file_list[currIndex+1]
result=比较两张图片是否相同(dir_image1,dir_image2)
if(result=="两张图相同"):
file_repeat.append(file_list[currIndex+1])
print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])
else:
print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])
currIndex+=1
ifcurrIndex>=len(file_list)-1:
break
#将重复的图片移动到新的文件夹,实现对原文件夹降重
forimageinfile_repeat:
shutil.move(image,save_path)
print("正在移除重复照片:",image)
以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习教程请关注我们
最新内容
相关内容
python如何执行python文件
python如何执行python文件,代码,培训,文件,程序,命令,模式,事半功倍,后缀,文本,以上,用文本编辑器写Python程序,然后保存为后缀为.py的文件,就python怎么生成xml文件
python怎么生成xml文件,数据,培训,设计,标准,文件,标记,语言,实例,模块,宗旨,用python内置的xml.dom可以对xml文件进行解析处理。什么是xml?Xpython包和文件夹有什么区别
python包和文件夹有什么区别,培训,单位,公共,文件夹,显卡,模块,大小,字节,剩余,实例,python包和文件夹有什么区别1、一个或多个文件夹组成一python不同大小文件的复制方法
python不同大小文件的复制方法,培训,文件,内容,大小,方法,顺序,以上,教程,更多,python不同大小文件的复制方法1、小文件复制,打开一个已有文python如何读取全部的文件
python如何读取全部的文件,培训,文件,路径,全部,方法,字符串,变量,实例,关键词,对象,python如何读取全部的文件说明1、文件路径可以是相对路python脚本如何指定文件
python脚本如何指定文件,培训,文件,脚本,参数,赋值,变量,路径,实例,以上,需求,python脚本如何指定文件1、说明(1)dest=files,是说将命令行中,--pythonos怎样处理系统文件
pythonos怎样处理系统文件,系统,培训,环境,代码,文件,环境变量,模块,操作系统,类型,代表,pythonos怎样处理系统文件1、获取系统类型对代码进pythonshutil有哪些操作文件的方法
pythonshutil有哪些操作文件的方法,名称,分析,培训,文件,操作,方法,函数,路径,以上,目标,pythonshutil有哪些操作文件的方法1、使用函数shuti关于C#:将二进制文件读入结构
关于C#:将二进制文件读入结构,关于C#:将二进制文件读入结构,读取,数据,文件,二进制,Read binary file into a struct我正在尝试使用C#读取JavaScript 文件名命名约定规定
JavaScript 文件名命名约定规定,JavaScript,文件名,命名,约定,规定,JavaScript,,JavaScript 文件名命名约定规定在 HTML 中加载 Jav