b984859fe0e4 - 简书

发简信

b984859fe0e4

6
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：广西

b984859fe0e4

大佬，这里布隆过滤器的数据是保存在每个taskmanager上还是jobmanager上呢，我咋觉得只是保存在taskmanager上的一个slot里面，这样不是没有同步数据，这样的话感觉还是有去重呀

谈谈三种海量数据实时去重方案（w/ Flink）
Prologue 数据去重（data deduplication）是我们大数据攻城狮司空见惯的问题了。除了统计UV等传统用法之外，去重的意义更在于消除不可靠数据源产生的脏数据...

LittleMagic
25839 16 28 2
b984859fe0e4

AlienPaul
写了 316255 字，被 1438 人关注，获得了 979 个喜欢

Java bug搬运工，小数据攻城狮^O^

b984859fe0e4

这个程序的DBUtil没有连接池，每次重新获取连接，性能消耗会不会很大？

Flink实现Kafka到Mysql的Exactly-Once
Flink实现Kafka到Mysql的Exactly-Once 背景最近项目中使用Flink消费kafka消息，并将消费的消息存储到mysql中，看似一个很简单的需求，在网...

it_zzy
10972 7 31
b984859fe0e4

[译]运行在YARN上的Spark程序的Executor，Cores和Memory的分配
好久没更新了，。。。太懒了。在跑Spark-On-Yarn程序的时候，往往会对几个参数（num-executors，executor-cores，executor-memo...

phusFuNs
10616 2 11
b984859fe0e4

楼主这教程很赞

Kafka 0.11.0.0 是如何实现 Exactly-once 语义的
原文地址：https://www.confluent.io/blog/exactly-once-semantics-are-possible-heres-how-apache...

大数据之心
22434 6 27
b984859fe0e4

Kafka 0.11.0.0 是如何实现 Exactly-once 语义的
原文地址：https://www.confluent.io/blog/exactly-once-semantics-are-possible-heres-how-apache...

大数据之心
22434 6 27
b984859fe0e4

使用Spark ML进行数据分析
Spark版本：2.4.0语言：Scala任务：分类这里对数据的处理步骤如下：载入数据归一化 PCA降维划分训练/测试集线性SVM分类验证精度输出cvs格式的结...

涛O_O
13881 3 16

b984859fe0e4

elasticsearch
LuoHaiPeng 编，15 篇文章，4 人关注
b984859fe0e4

LuoHaiPeng
写了 51350 字，被 113 人关注，获得了 137 个喜欢

把每一天都当作是第一天和最后一天
b984859fe0e4

ElasticSearch（一）简介
作者：罗海鹏，叩丁狼教育高级讲师。原创文章，转载请注明出处。前言我们建立一个网站或者一个应用通常都会有搜索的功能，如果我们做的只是用户量很少的内网项目，并且搜索的字...

叩丁狼教育
928 0 2
b984859fe0e4

叩丁狼教育
写了 327004 字，被 3756 人关注，获得了 3767 个喜欢

我在探索Java的路上，停不下来
b984859fe0e4

顶尖 API 文档管理工具 (YAPI)
▶ 使用 Docker 部署 YAPI 1、运行 MongoDB 2、获取 YAPI 镜像，其他版本：阿里云镜像仓库[https://dev.aliyun.com/detai...

Anoyi
226760 183 456

b984859fe0e4

JUC源码分析-线程池篇（四）：ForkJoinPool - 1
在整个JUC框架中，ForkJoinPool 相对其他类会复杂很多，想吃透它需要有足够的耐心，ForkJoinPool两篇文章从草稿到发布，笔者前前后后使用了近两个月才完成。...

泰迪的bagwell
16458 6 25
b984859fe0e4

ZPPenny
写了 28025 字，被 181 人关注，获得了 143 个喜欢
b984859fe0e4

【Spark系列】spark中job，stage，task之间的关系
1.什么是job Job简单讲就是提交给spark的任务。 2.什么是stage Stage是每一个job处理过程要分为的几个阶段。 3.什么是task Task是每一个jo...

木亦汐
4139 1 6
b984859fe0e4

Elasticsearch学习(三)—JAVA API操作（Index、Document）
API 文档官方地址 RestClient Elasticsearch 会在7.0之后的版本废弃TransportClient，在8.0之后的版本移除TransportCl...

_li_
13960 0 2
b984859fe0e4

优雅的使用Kafka Consumer
如何消费数据我们已经知道了如何发送数据到Kafka,既然有数据发送,那么肯定就有数据消费,消费者也是Kafka整个体系中不可缺少的一环 push 还是 pull Kafka...

zy_think123
60570 5 24

b984859fe0e4

孙强Jimmy
写了 73367 字，被 380 人关注，获得了 815 个喜欢

微信：jimmysundev<br>CSDN：<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fjimmysun.blog.csdn.net%2F" target="_blank">https://jimmysun.blog.csdn.net/</a><br>GitHub：<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2Fjimmysuncpt" target="_blank">https://github.com/jimmysuncpt</a>

暂无个人介绍