最近华为云发布了垃圾分类识别的比赛,就注册账号,想看看。从官网上下载了数据,发现图片和txt文档是放在一个文件夹里的。其中命名对应的txt中是标明了该图片的垃圾分类ID
但其实在分析数据的过程中,我希望查看一下每个分类下面的图片的情况,所以希望按照将同一个分类的图片能放在同一个文件夹中,以方便查看。 这时候,就用了到了shutil库
同时,因为类目ID和垃圾分类类目的关系存储在了另外的一个JSON文件中,也需要将其读取进来,然后根据映射情况来命名文件夹
具体的代码和详细备注如下:
#coding:utf-8
import os
import json
import shutil
import re
#读取下载的文件
f_list = os.listdir('下载的文件地址路径')
#将类目ID同分类映射的JSON文件读进来
with open('JSON文件地址路径', encoding='utf-8') as f:
rules = json.loads(f.read())
f.close()
#开始来拷贝文件了
for file in f_list:
#由于文件夹中有txt文件和jpeg两种格式,需要进行处理,读取txt格式文件
if os.path.splitext(file)[1] == '.txt':
imgID =file.replace('.txt','')
f=open('下载的文件地址路径'+'/'+file,'r+').readlines()
file_name,cateID=f[0].split(',')
#小细节处理,因为上一步对文件处理提取cateID是,得到的格式是‘ 1’而不是‘1’,故需要处理一下用re库的replace删除
fold_name=rules[cateID.replace(' ','')]
#另一处小细节处理,看上图可以看到数据中的命名为'可回收垃圾/旧衣服',这样在Python路径中作为文件名会导致多一层文件,故改成了’可回收垃圾_旧衣服‘
fold_name=fold_name.replace('/','_')
#设置最后要拷贝的文件名称
determination = '文件夹路径名'+fold_name+'/'
#判断文件夹是否存在
if not os.path.exists(determination):
os.makedirs(determination)
#从一个文件中往另外一个文件夹移动文件
shutil.copyfile('下载的文件地址路'+file_name, determination+file_name)
print('Done')
最后可以看到拷贝移动完后的结果如下图: