作为新手,之前写过一些的python小功能,但转眼又忘了,现在想把之前写过的常见的实用简单的小功能重新修改下,放到简书上面来。
项目需求如下:
一个文件夹下面有很多个文件夹,每个文件下里面又有多个相同结构的Excel文件,结构如下面的截图,把所有的Excel记录合并到一个表格中。
首先找出目标文件夹下面的所有Excel表格
import os
#获取目标文件夹下的所有Excel文件路径,并保存到file_path中
def get_all_file(raw_path):
all_file=os.walk(raw_path)
file_path=[]
for i in all_file:
if i[2]==[]:
continue
for each_file in i[2]:
if '.xl' in each_file:#可能为xls或者xlsx
a_path=os.path.join(i[0],each_file)
file_path.append(a_path)
return file_path
获取了所有文件路径后就是合并Excel文件。
之前本来打算用xlrd之外的模块,但发现现在的xlrd已经支持读取xlsx文件了。
import xlrd
import xlwt
def hebing_xls(file_path,save_path,all_sheet=False):
#创建一个新的xls文件
workbook = xlwt.Workbook(encoding='utf-8',style_compression=0)
sheet = workbook.add_sheet("sheet1",cell_overwrite_ok = True)
num=1#从每个文件的第二列开始复制
for each in file_path:
data = xlrd.open_workbook(each)
#all_sheet 是考虑到可以一个Excel文件有多个表格,sheet1,sheet2之类的,用于辨别
if all_sheet==True:
sheet_num=len(data.sheet_names())
else:
sheet_num=1
for index in range(sheet_num):
table = data.sheets()[index]
hang=table.nrows
lie=table.ncols
#读取第一行,写入标题行
if num==1:
first_row = table.row_values(0)
for each in first_row:
sheet.write(0,first_row.index(each),each)
#只有标题行,没有记录,则不合并
if hang<2:
continue
else:
for i in range(hang)[1:]:
for j in range(lie):
a=table.cell(i,j).value
sheet.write(num,j,a)
num=num+1
#print (num, 'finish')
workbook.save(save_path)
下面附上完整代码
import xlrd
import os
import xlwt
def get_all_file(raw_path):
all_file=os.walk(raw_path)
file_path=[]
for i in all_file:
if i[2]==[]:
continue
for each_file in i[2]:
if '.xl' in each_file:
bet_path=os.path.join(i[0],each_file)
file_path.append(bet_path)
return file_path
def hebing_xls(file_path,save_path,all_sheet=False):
workbook = xlwt.Workbook(encoding='utf-8',style_compression=0)
sheet = workbook.add_sheet("sheet1",cell_overwrite_ok = True)
num=1
for each in file_path:
data = xlrd.open_workbook(each)
#all_sheet表示是否每个表格都读取
if all_sheet==True:
sheet_num=len(data.sheet_names())
else:
sheet_num=1
for index in range(sheet_num):
table = data.sheets()[index]
hang=table.nrows
lie=table.ncols
#读取第一行,写入标题行
if num==1:
first_row = table.row_values(0)
for each in first_row:
sheet.write(0,first_row.index(each),each)
#只有标题行,没有记录,则不合并
if hang<2:
continue
else:
for i in range(hang)[1:]:
for j in range(lie):
a=table.cell(i,j).value
sheet.write(num,j,a)
num=num+1
#print (num, 'finish')
workbook.save(save_path)
if __name__ == '__main__':
raw_path=r'G:\project\data'
save_path=r'G:\hebing.xls'
file_path=get_all_file(raw_path)
hebing_xls(file_path,save_path,True)
print('end')