240 发简信
IP属地:广东
  • 好奇为啥要对逻辑优化后的RelNode分析,最初始的RelNode里面的metadata映射关系也应该没问题的吧?

    基于Calcite解析Flink SQL列级数据血缘

    数据血缘 数据血缘(data lineage)是数据治理(data governance)的重要组成部分,也是元数据管理、数据质量管理的有力工具。通俗地讲,数据血缘就是数据在...

  • 期待下篇。。。

    Flink SQL w/ Blink Planner执行流程解析(上篇)

    Foreword 大数据领域SQL化的风潮方兴未艾(所谓"Everybody knows SQL"),Flink自然也不能“免俗”。Flink SQL是Flink系统内部最高...

  • @学木 有配置,后面发现hive接口没有加载到hive_site.xml相关配置,做了下调整

    Flink 连接 hive 解决 java.net.UnknownHostException

    错误 今天在实验 Flink 连接 hive 的操作,由于 CDH 的 hadoop 是 HA,连接过程中报错如下: 解决方式 1.配置 HADOOP_CONF_DIR 环境...

  • 2.flink-conf.yaml 配置 env.hadoop.conf.dir
    采用了这种方式,依然无效

    Flink 连接 hive 解决 java.net.UnknownHostException

    错误 今天在实验 Flink 连接 hive 的操作,由于 CDH 的 hadoop 是 HA,连接过程中报错如下: 解决方式 1.配置 HADOOP_CONF_DIR 环境...

  • [spark] Shuffle Read解析 (Sort Based Shuffle)

    Shuffle Write 请看 Shuffle Write解析。 本文将讲解shuffle Reduce部分,shuffle的下游Stage的第一个rdd是ShuffleR...