Python获取文件夹下所有文件类型-用集合删除重复项

1. 遍历文件目录

import os
for dirpath, dirnames, filenames in os.walk('D:\迅雷下载'):
    print(dirpath)
    print(dirnames)
    print(filenames)
  • dirpath:string,代表目录的路径,会遍历所有子文件夹;
  • dirnames:list,包含了当前dirpath路径下所有的子目录名字(不包含目录路径),会遍历所有子文件夹;
  • filenames:list,包含了当前dirpath路径下所有的非目录子文件的名字(不包含目录路径),会遍历所有子文件夹。

2. 创建集合

set1 = set()    # 新建
set2 = {1,2,3}    # 新建包含值 

set1.add(5)    # 增加一个元素5
set.update([5,6,7,8])    # 增加多个元素

set1.remove(1)    # 删除元素“1”

3. 拆分文件名和后缀

os.path.splitext(file)[0]
os.path.splitext(file)[1]

4.完整代码

import os
set1 = set()

def getFile(sourcePath):
  for root, dirs, files in os.walk(sourcePath):
      for file in files:
          set1.add(os.path.splitext(file)[1])


getFile('D:\迅雷下载')
print(set1)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,981评论 19 139
  • linux资料总章2.1 1.0写的不好抱歉 但是2.0已经改了很多 但是错误还是无法避免 以后资料会慢慢更新 大...
    数据革命阅读 12,239评论 2 33
  • Ubuntu的发音 Ubuntu,源于非洲祖鲁人和科萨人的语言,发作 oo-boon-too 的音。了解发音是有意...
    萤火虫de梦阅读 99,587评论 9 467
  • 其实大部分时候,清醒时候可以控制自己不喝酒,却是为了放空自己而喝;喝到一半可以确保自己不醉,却为了找一个发泄的出口...
    北国绿豆阅读 146评论 0 0
  • 大学对于高三毕业的人来说无非是憧憬的圣堂,每个人都幻想着踏进圣堂的生活。在这个网络高度发达的社会,毕业生们又通过一...
    爱吃零食的老总阅读 622评论 0 2