如何通过Power Query合并多个工作薄


合并工作薄的方法大体上有3种:

1)数据量少的时候,手动复制各表粘贴到一个表  

2)使用WPS的合并表格功能:数据-合并表格;这个操作方便快捷,主要问题是收费,我2020年使用这个功能还未收费,2021年开始使用这个功能就需要购买会员了。不知道是否存在大数据杀熟,有些账号登录WPS合并表格功能是不收费的。

WPS合并表格

3)通过Power Query合并多个工作薄:

excel不能处理几十万条的数据量,使用Excel的插件Power Query可以做到

Excel 能存多少数据?Excel2003版本的xls格式文件可以支持最多65536行数据,Excel2007以上版本的xlsx格式文件可以支持1048576行数据。在导入超过65536行数据的文件时可以选择升级office版本后再进行导入或将文件格式保存为xlsx格式后再进行导入。信息量达到6万条的话,文件会相当庞大,运行缓慢,并频繁死机同时几十万条就不要想了,整理不了

那么如何通过Power Query合并多个工作薄?

纵观全网,我推荐 PowerBI星球的文章:掌握这些技巧,Power Query批量合并Excel再也不会出问题了//www.greatytc.com/p/9539db699b4a

下面是我操作的实践记录:

以批量汇总文件夹的Excel工作簿为例,

在这个文件夹中,有1月品牌、2月品牌、3月品牌三个Excel工作表,每个工作表包含2个sheet,sheet1是需要合并的表,sheet2不需要合并。

我们先在文件夹外建一个新表:表1  格式是xlsx

新建一个表用来放合并后的数据

打开表1  数据-获取数据-自文件-从文件夹-找到我们放待合并工作表的文件夹。从这里也可以看出还能从数据库里获取数据。自文件-从工作薄 可以从一个工作表里合并工作薄


选中文件夹后 点击打开就看到下图


我们点击转换数据-合并并转换数据,不要点击组合选项


之后的操作步骤如下:

1、删除其他列:选中[Content],点击鼠标右键-删除其他列  或者选中[Content] 在标题栏删除列-删除其他列。你也可以根据需要保留部分列。




2、新建自定义列: 标题栏 添加列-自定义列

结果如图:

3、自定义列公式:=Excel.Workbook([Content],true)   看下没有语法错误 

等号后边是一个M函数,用来提取表格里面的信息,大家一定注意,M函数是严格区分大小写的,不能将大小写混用,符号必须在英文输入法状态下输入

对于Excel工作簿文件,输入:=Excel.Workbook([Content],true)的含义是

导入到PowerQuery中的数据默认都是类型为binary类型,需要用函数将它解析出来

4、 展开自定义列 点击自定义列的展开按钮,取消使用原始列名作为前缀,确定

5、Item 筛选 要合并的sheet1,确定 

4、

6、 展开Data列 -选择你要的列名- 确定

7、左上角:文件-关闭并上载 

8、ctrl+s 保存 结果如下表

这种算是手工合并数据,但相比自动合并,也就是输入一个简短的M函数,多点了几次鼠标而已,熟练操作后,整个过程不会超过一分钟。


@通过上面的描述和操作过程,涉及到两个常用的PowerQuery合并技巧:

1, 为了避免出现杂乱的查询文件,使用“转换数据”,手动合并;

2. 新建自定义列时,Excel.Workbook的第二个参数不要省略,当参数为true时,会自动将Excel的第一行用作标题,可以省去一个步骤。

并且在手动合并的过程中,灵活运用,可以方便的进行各种形式的数据合并。

@另外发现最右侧一列,点击文本前的叉就可以返回上一步操作


@最开始为什么不选择组合-合并并转换数据?

组合-合并并转换数据是大家最常用的操作方式,来看看这样做的结果是什么。

虽然完成了一键批量合并,非常快捷,但是左边查询栏多出很多不需要的查询,看着很乱,可是如果你想删除,是不是怎么也删除不掉?

这些查询PowerQuery执行合并操作时,默认操作过程留下的中间文件,当你点击"合并并转换数据"时,PowerQuery先根据其中一个文件作为示例,生成一个自定义函数,然后调用自定义函数,完成合并。

自动合并,除了会留下一堆杂乱的查询无法删除,还有个问题是,如果合并结果出错(出错的概率很高),需要修改示例文件或者自定义函数的代码,但是对于初学者是比较困难的,很多人不知道如何修改。

所以不建议使用默认的合并操作,在导入之后的预览窗口,推荐你使用“转换数据”

我们也可以合并文件夹中的某一类型数据。

@如果文件夹中的文件类型,不止一种,还可以选择按文件类型合并。

假如文件夹中既有Excel格式,还有csv、txt格式的数据文件,如果直接全部合并会报错,那么可以按类型分别单独合并。

依然在【源】这个步骤中,可以按数据格式来筛选。

 csv、txt格式的数据合并技巧。

上面添加自定义列时用的是Excel.Workbook,是专门用来解析Excel格式的,当数据格式为csv或txt时,需要换个解析函数。

csv、txt格式本质上属于同一种类型,都可以使用这个函数Csv.Document,为了避免中文出错,一般情况下自定义列可以直接这样写:

=Csv.Document([Content],[Delimiter=",",  Encoding=936])

其中Delimiter=","是对逗号分割的数据,如果你的源数据是其他符号分割,这里就改为相应的符号;中文编码一般为936,所以上面代码中用了Encoding=936来避免中文乱码的问题。

以上

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,948评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,371评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,490评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,521评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,627评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,842评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,997评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,741评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,203评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,534评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,673评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,339评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,955评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,770评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,000评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,394评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,562评论 2 349

推荐阅读更多精彩内容