今天,有一个任务,将两张excel表格中的相同数据找出,一张表稍小,有40条数据,另外一张表有大概2500条数据,找出其中相同的数据,然后再将相同数据的用户手机号标注出来,如果是手动Ctrl+F,Ctrl+V,费时费力还有可能出错,所以我就在网上找了找关于python操作excel表格的操作,然后就实现了python的自动化查找,现将代码及注释分享个大家
def main():
"""
获取两表中相同的apikey,然后将其用户的手机和apikey写入新的表格中
:return:
"""
apikeys = [] # 定义存储用户apikey列表
phones = [] # 定义存储用户手机号列表
workbook1 = xlrd.open_workbook(r"C:\Users\admin\Desktop\BT城市代理商+手机号归属地.xlsx") # 打开表格
sheet1 = workbook1.sheet_by_index(0) # 使用第一张工作表
apikey = sheet1.col_values(9) # 获取第10列内容
while '' in apikey: # 列表去空
apikey.remove('')
workbook2 = xlrd.open_workbook(r"C:\Users\admin\Desktop\UC数据.xlsx")
sheet2 = workbook2.sheet_by_index(0)
for userinfo in sheet2.get_rows(): # 获取表格所有行
if str(userinfo[28])[6:-1] in apikey: # 用户信息列表中第29个元素为用户apikey
apikeys.append(str(userinfo[28])[6:-1]) # 添加用户apikey
phones.append(str(userinfo[5])[6:-1]) # 添加用户手机
excel(apikeys, phones)
def excel(api1, phone1):
"""
将用户apikey和手机号写入表格
:param api1:
:param phone1:
:return:
"""
data = pd.DataFrame({'用户apikey': api1, '绑定手机号': phone1})
pd.DataFrame.to_excel(data, "D:\\用户信息统计表.xls", header=True, encoding='gbk', index=False)
print("用户信息写入表格完成")
def main2():
"""
python关于excel的相关操作
:return:
"""
workbook = xlrd.open_workbook(r"C:\Users\admin\Desktop\BT城市代理商+手机号归属地.xlsx")
sheet1 = workbook.sheet_by_index(0) # 通过工作表索引获取第一张工作表
sheet2 = workbook.sheet_by_name("sheet2") # 通过名称获取工作表
print(sheet2.name, sheet2.nrows, sheet2.ncols) # 输出工作表的名称,包含行数,列数
print(sheet2.cell(0, 5).value) # 获取指定单元格数据
print(sheet2.col_values(9)) # 获取指定列数据
print(sheet2.row_values(5)) # 获取指定行数据
print(sheet2.get_rows()) # 获取所有行数据
# 列表去空
phone = sheet2.col_values(9)
while '' in phone:
phone.remove('')
for i in phone:
print(i)
# 比较两个列表中的相同元素
list1 = [45, 34, 67, 8]
lsit2 = [1, 5, 78, 45]
set1 = set(list1)
set2 = set(lsit2)
set3 = set1 & set2 # 两个集合取交集
print(set3)
if __name__ == '__main__':
main()