爬图片是另一篇文章,以后更新。先说说如果当初爬的时候没有对格式进行输出的整理,那么拿到的将会是一堆杂乱无章的图片,当然,这事儿不是我干的。大量的图片手动改名?——No, No, No, 那怎么还会在这里废话!?
os和shutil
先导入这两个模块,处理文件目录少不了os模块,包含了通用的操作系统功能,与具体的平台无关。shutil模块也是Python自带,用于文件的复制,移动等。
- os模块常用操作:
os.listdir(path) 返回指定目录下的所有文件和目录名。
os.rename(src, dst) 重命名一个目录或文件(src到dst)
os.renames(old, new) 递归重命名文件夹或者文件
os.remove(path)删除一个文件
os.rmdir(path)方法用于删除指定路径的目录。仅当这文件夹是空的才可以, 否则, 抛出OSError - shutil模块常用操作
shutil.copyfile( src, dst) 从源src复制到dst中去。当然前提是目标地址是具备可写权限。抛出的异常信息为IOException. 如果当前的dst已存在的话就会被覆盖掉
shutil.move( src, dst) 移动文件或重命名
shutil.copymode( src, dst) 只是会复制其权限其他的东西是不会被复制的
shutil.copystat( src, dst) 复制权限、最后访问时间、最后修改时间
shutil.copy( src, dst) 复制一个文件到一个文件或一个目录
更多操作可以参考友情链接:http://www.jb51.net/article/50070.htm
文件重命名示例
好了,现在我们有这么一个文件夹:
想要整理之后得到这样的效果:
如图展示的整理效果,最终就一个文件夹,里面是统一命名的图片,不过内容有差别,下载的时候将需要的Logo放在里一个文件夹里作为子目录,与其同级的是许多照片,并且任选其中一张作为首页图(首页.jpg),其他的是内容(内容1.jpg,内容2.jpg等等)。是的,图片的格式还有png,我们全部改成jpg。
- 找到文件路径
base_path = 'E:/XX/XX/' # 目标文件夹位置
in_path = 'E:/XX/XX/Download_Img_org/' # 目标文件夹的完整路径
out_path = in_path
我们将文件夹里面的图片重命名以后还是放在原始文件夹里面,让输出路径与in_path一样的。
- 重命名
列出所有照片(文件)的名字,取出来放在一个列表中,方便后面查找使用。找到其中一张照片(就选第一张好了)作为首页图片。
in_content_name = os.listdir(in_path) # 回目录下的所有文件和目录名
for in_name in in_content_name:
in_content_path = in_path + in_name
in_path_list.append(in_content_path)
# print(in_content_path) # 这里可以尝试打印确认看看
os.rename(in_path_list[0], out_path + '首页' + '.jpg')
然后其他的图片是内容+序号,从前面的in_path_list取出来使用就好。但此时的目录下既有文件还有子目录,需要先对文件进行处理,用到os.path.isdir(path)判断一个路径是文件还是目录,接着遍历文件更名。
n = 1
for path in in_path_list[1:]:
if os.path.isdir(path) is True:
out_folder_name = path.split('/')[-1]
# print(out_folder_name)
elif n <= len(in_path_list)-2: # 去除子目录和改为首页.jpg的图片
os.rename(path, out_path + '内容' + str(n) + '.jpg')
n += 1
那么最后剩下的是对子目录中的文件更名并把子目录的文件名作为更新后的上级目录名称。操作也是类似的,这里就用到了shutil模块的一些操作。直接上代码+注释:
out_content_name = os.listdir(out_path)
for out_name in out_content_name:
out_content_path = out_path + out_name
out_path_list.append(out_content_path)
if os.path.isdir(out_content_path) is True:
# print(os.listdir(out_content_path)) 打印的结果是列表,下面添加srcdir的时候不能直接转换为字符串,需用for循环取出
for logo_name in os.listdir(out_content_path):
if logo_name != 'Logo.jpg':
os.rename(out_content_path + '/' + logo_name, out_path + 'Logo.jpg') # 重命名另存到外部路径下
os.rmdir(out_content_path)
else:
shutil.copy(out_content_path + '/' + logo_name, out_path) # 将文件直接copy,不改名
os.remove(out_content_path + '/' + logo_name)
os.rmdir(out_content_path)
os.rename(base_path + out_path.split('/')[-2], base_path + str(out_folder_name))
print('Folder ' + str(out_folder_name) + ' is done.') # 更改文件操作已经完成!
--------------------------------------------最后?----------------------------------------
之前想要解决文件批处理问题,临时去查了一些方法并应用起来,抛开算法和效率不说,也太low(=。=)这里展示的文件处理是在一个文件夹的文件,那么还有这样许许多多的文件夹怎么办?下一篇讲图片像素处理,很多文件夹里的图片批处理。。。
学无止境!