240 发简信
IP属地:山西
  • 第二种方案其实就是拉链表

    数仓--Theory--缓慢变化维SCD及表设计

    业务背景 在从 OLTP 业务数据库向 DW 数据仓库抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会遇到这样的问题:业务数据库中的一些数据发生了更改,到底要不要...

  • mapPartitions和foreachPartition哪个更适合插入MySQL场景来使用呢?

    map 和 mapPartitions

    map:遍历算子,可以遍历RDD中每一个元素,遍历的单位是每条记录 mapPartitions遍历算子,可以改变RDD格式,会提高RDD并行度,遍历单位是partition,...

  • 博主 可以解释一下这行代码什么意思吗?result.::(cur).iterator 有点没看懂

    Spark学习(六):map & mapPartitions

    对于一些没有用过的函数或者操作,看文字描述总是觉得很晦涩,很难理解,所以学习的时候我比较倾向于先从小例程入手,以便有直观的理解。关于这两个函数网上的介绍很多,但找了很久才找到...

  • 视频讲的一般还收费 差评

    Kudu视频教程|Kudu分布式存储引擎

    网盘地址:https://pan.baidu.com/s/1lZUyorE8reEvRkS4izb61g 提取码: f19f 备用地址(腾讯微云):https://share...

  • 那黑客循环查询数据库感觉也应该叫拖库,这个名字比较适合。

    漫话:如何给女朋友解释什么是撞库、脱库和洗库?

    来自公众号:漫话编程关于作者:漫话编程,是一个通过漫画+音频的形式讲解枯燥的编程知识的公众号。致力于让编程变得更有乐趣。 最近,安全圈又有一个大新闻,微博名为@安全_云舒的微...