用自定义函数批量处理json文件

我用Slack搜集PowerBI的资讯，今天突然发现Slack可以导出数据，于是全部导出。
不足19M的导出文件，下载了好久。不知是否没翻墙的缘故。
导出的文件是按channel来分的，每个channel下都包含一个“年-月-日.json”的文件，所以，凡是某天获取到了消息，就会有一个json文件，该天的所有消息都包含在这个json文件中。
既然有几百个json文件需要处理，我第一反应是建立一个从文件夹获取的源，就像处理csv那样，期待power bi desktop能够自动创建函数，自动合并这些json文件。可惜这次power bi desktop出错了。

自动合并json出错

所以此路不通。
最近刚好对自定义函数感兴趣，那么尝试用自定义函数来解决此问题。

首先按照创建自定义函数的步骤，引入一个单独的json文件，对其进行处理。

let
    源 = Json.Document(File.Contents(para)),
    转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"展开的“Column1”" = Table.ExpandRecordColumn(转换为表, "Column1", {"text", "bot_id", "attachments", "type", "subtype", "ts"}, {"text", "bot_id", "attachments", "type", "subtype", "ts"}),
    删除的其他列 = Table.SelectColumns(#"展开的“Column1”",{"attachments"}),
    #"展开的“attachments”" = Table.ExpandListColumn(删除的其他列, "attachments"),
    #"展开的“attachments”1" = Table.ExpandRecordColumn(#"展开的“attachments”", "attachments", {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}, {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}),
    删除的副本 = Table.Distinct(#"展开的“attachments”1", {"text"})
in
    删除的副本

注意第一句中的“jsonpath”是实际的单独json文件所在的全路径，要加引号。
处理完毕后，把“源”这一步中的FileContents括号中的内容全部换成一个参数，比如就用jsonpath。然后在PowerBI desktop中新建一个同名参数，把刚才的文件路径作为其值。
接下来，在PowerBI desktop中窗口左侧，选中刚才这个查询，右键选择，创建为函数。下面为创建好的函数代码。注意我用的参数是para

let
    源 = (para as text) => let
        源 = Json.Document(File.Contents(para)),
        转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
        #"展开的“Column1”" = Table.ExpandRecordColumn(转换为表, "Column1", {"text", "bot_id", "attachments", "type", "subtype", "ts"}, {"text", "bot_id", "attachments", "type", "subtype", "ts"}),
        删除的其他列 = Table.SelectColumns(#"展开的“Column1”",{"attachments"}),
        #"展开的“attachments”" = Table.ExpandListColumn(删除的其他列, "attachments"),
        #"展开的“attachments”1" = Table.ExpandRecordColumn(#"展开的“attachments”", "attachments", {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}, {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}),
        删除的副本 = Table.Distinct(#"展开的“attachments”1", {"text"})
    in
        删除的副本
in
    源

函数创建好之后，可以对其命名以免自己弄混掉，也可以保持原名称。我将其命名为“json”。

接下来的步骤是我们要将json这个自定义函数应用到文件夹下每一个文件上。而应用的办法就是构造这个自定义函数的参数值，这个参数值是一个全路径。因此，按照处理文件夹下所有文件的步骤，建立一个引入文件夹的源，将该文件夹下所有的文件引入进来。

let
    源 = Folder.Files("C:\Users\wanght\Desktop\general"),
    删除的其他列 = Table.SelectColumns(源,{"Name", "Folder Path"}),
    已添加自定义 = Table.AddColumn(删除的其他列, "自定义", each json([Folder Path]&[Name])),
    #"展开的“自定义”" = Table.ExpandTableColumn(已添加自定义, "自定义", {"user", "type", "subtype", "text", "ts"}, {"user", "type", "subtype", "text", "ts"}),
    筛选的行 = Table.SelectRows(#"展开的“自定义”", each ([text] <> "")),
    删除的副本 = Table.Distinct(筛选的行, {"text"}),
    删除的其他列1 = Table.SelectColumns(删除的副本,{"Name", "text"}),
    替换的值 = Table.ReplaceValue(删除的其他列1,".json","",Replacer.ReplaceText,{"Name"}),
    更改的类型 = Table.TransformColumnTypes(替换的值,{{"Name", type date}}),
    重命名的列 = Table.RenameColumns(更改的类型,{{"Name", "日期"}})
in
    重命名的列

第一步源是引入文件夹作为源。
第二步我选择了仅保留“Name”和“Folder Path”两列。保留“Name”的原因是因为其中包含了文件名，而“Folder Path”则包含了路径。在下一步我们将利用这两列每一行的值构造前面自定义函数json的参数（那是一个全路径）。
第三步是关键操作，新增一列，引入自定义函数json，并用上一步保留的两列来构造函数json的参数。
之后的步骤是对数据本身进行处理了，超出本文范围，不再赘述。

最后编辑于：2017.12.10 02:33:44

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,496评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,407评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,632评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,180评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,198评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,165评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,052评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,910评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,324评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,542评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,711评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,424评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,017评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,668评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,823评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,722评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,611评论 2赞 353

用自定义函数批量处理json文件

推荐阅读更多精彩内容