用自定义函数批量处理json文件

我用Slack搜集PowerBI的资讯,今天突然发现Slack可以导出数据,于是全部导出。
不足19M的导出文件,下载了好久。不知是否没翻墙的缘故。
导出的文件是按channel来分的,每个channel下都包含一个“年-月-日.json”的文件,所以,凡是某天获取到了消息,就会有一个json文件,该天的所有消息都包含在这个json文件中。
既然有几百个json文件需要处理,我第一反应是建立一个从文件夹获取的源,就像处理csv那样,期待power bi desktop能够自动创建函数,自动合并这些json文件。可惜这次power bi desktop出错了。


自动合并json出错

所以此路不通。
最近刚好对自定义函数感兴趣,那么尝试用自定义函数来解决此问题。

首先按照创建自定义函数的步骤,引入一个单独的json文件,对其进行处理。

let
    源 = Json.Document(File.Contents(para)),
    转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"展开的“Column1”" = Table.ExpandRecordColumn(转换为表, "Column1", {"text", "bot_id", "attachments", "type", "subtype", "ts"}, {"text", "bot_id", "attachments", "type", "subtype", "ts"}),
    删除的其他列 = Table.SelectColumns(#"展开的“Column1”",{"attachments"}),
    #"展开的“attachments”" = Table.ExpandListColumn(删除的其他列, "attachments"),
    #"展开的“attachments”1" = Table.ExpandRecordColumn(#"展开的“attachments”", "attachments", {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}, {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}),
    删除的副本 = Table.Distinct(#"展开的“attachments”1", {"text"})
in
    删除的副本

注意第一句中的“jsonpath”是实际的单独json文件所在的全路径,要加引号。
处理完毕后,把“源”这一步中的FileContents括号中的内容全部换成一个参数,比如就用jsonpath。然后在PowerBI desktop中新建一个同名参数,把刚才的文件路径作为其值。
接下来,在PowerBI desktop中窗口左侧,选中刚才这个查询,右键选择,创建为函数。下面为创建好的函数代码。注意我用的参数是para

let
    源 = (para as text) => let
        源 = Json.Document(File.Contents(para)),
        转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
        #"展开的“Column1”" = Table.ExpandRecordColumn(转换为表, "Column1", {"text", "bot_id", "attachments", "type", "subtype", "ts"}, {"text", "bot_id", "attachments", "type", "subtype", "ts"}),
        删除的其他列 = Table.SelectColumns(#"展开的“Column1”",{"attachments"}),
        #"展开的“attachments”" = Table.ExpandListColumn(删除的其他列, "attachments"),
        #"展开的“attachments”1" = Table.ExpandRecordColumn(#"展开的“attachments”", "attachments", {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}, {"author_name", "fallback", "text", "id", "author_link", "author_icon", "color", "fields", "mrkdwn_in"}),
        删除的副本 = Table.Distinct(#"展开的“attachments”1", {"text"})
    in
        删除的副本
in
    源

函数创建好之后,可以对其命名以免自己弄混掉,也可以保持原名称。我将其命名为“json”。

接下来的步骤是我们要将json这个自定义函数应用到文件夹下每一个文件上。而应用的办法就是构造这个自定义函数的参数值,这个参数值是一个全路径。因此,按照处理文件夹下所有文件的步骤,建立一个引入文件夹的源,将该文件夹下所有的文件引入进来。

let
    源 = Folder.Files("C:\Users\wanght\Desktop\general"),
    删除的其他列 = Table.SelectColumns(源,{"Name", "Folder Path"}),
    已添加自定义 = Table.AddColumn(删除的其他列, "自定义", each json([Folder Path]&[Name])),
    #"展开的“自定义”" = Table.ExpandTableColumn(已添加自定义, "自定义", {"user", "type", "subtype", "text", "ts"}, {"user", "type", "subtype", "text", "ts"}),
    筛选的行 = Table.SelectRows(#"展开的“自定义”", each ([text] <> "")),
    删除的副本 = Table.Distinct(筛选的行, {"text"}),
    删除的其他列1 = Table.SelectColumns(删除的副本,{"Name", "text"}),
    替换的值 = Table.ReplaceValue(删除的其他列1,".json","",Replacer.ReplaceText,{"Name"}),
    更改的类型 = Table.TransformColumnTypes(替换的值,{{"Name", type date}}),
    重命名的列 = Table.RenameColumns(更改的类型,{{"Name", "日期"}})
in
    重命名的列

第一步源是引入文件夹作为源。
第二步我选择了仅保留“Name”和“Folder Path”两列。保留“Name”的原因是因为其中包含了文件名,而“Folder Path”则包含了路径。在下一步我们将利用这两列每一行的值构造前面自定义函数json的参数(那是一个全路径)。
第三步是关键操作,新增一列,引入自定义函数json,并用上一步保留的两列来构造函数json的参数。
之后的步骤是对数据本身进行处理了,超出本文范围,不再赘述。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,652评论 18 139
  • 发现 关注 消息 iOS 第三方库、插件、知名博客总结 作者大灰狼的小绵羊哥哥关注 2017.06.26 09:4...
    肇东周阅读 12,094评论 4 62
  • 有90分以上的吗?没有吧!或许真的很少 有的话,我就追你 然后,一起去旅行,哈哈。
    氵嘟嘟阅读 726评论 3 2
  • 最近看了很多关于关于“我在XX刚刚好,何必羡慕XXX”,无非是夸赞自己的家乡,厌恶繁华城市的快节奏罢了。但人生哪有...
    梓熙姑娘阅读 983评论 2 10
  • 开会。每一个产品经理都不会陌生。从产品的调研、MRD、立项...到最后产品的诞生,期间大大小小会议非常多。我最近开...
    脚下日月阅读 648评论 8 14