一个懒散的人

发简信

一个懒散的人

13
关注
21
粉丝
29
文章
4147

字数
29

收获喜欢
32

总资产

IP属地：陕西

攻城老狮

Hadoop HDFS操作指南
1 HDFS 组成架构 NameNode（NN）管理HDFS的名称空间配置副本策略管理数据块（Block）映射信息处理客户端读写请求 DataNode（DN）存储实际的数据块...

1307 0 16
Java弟中弟

JVM调优的几种场景（建议收藏）
最近很多小伙伴跟我说，自己学了不少JVM的调优知识，但是在实际工作中却不知道何时对JVM进行调优。今天，我就为大家介绍几种JVM调优的场景。在阅读本文时，假定大家已经了解了...

626 0 1
一个懒散的人

GeoSpark-[阶段性总结]
一、 Geospark安装：我采用的是gradle安装，安装环境是Spark3.0.3+Scala.2.12.3 二、 Geospark 能够读取文件的结构有：CSV,TS...

1088 0 1
一个懒散的人

SparkSQL字段血缘关系的实现方式
说明： spark sql的字段血缘关系具体实现代码和使用方法见GitHub：RHobart/spark-lineage-parent: 跟踪Spark-sql中的字段血缘关...

2874 0 2
一个懒散的人

DeltaLake批处理：数据表的读取与写入
DeltaLake支持大部分由Spark DataFrame提供的Opition选项 SparkSession的配置创建表 DeltaLake支持通过路径或者元数据查询表，...

682 0 1
烂泥_119c

hive字段级别血缘实现
背## 背景为便于hive表数据上下游的管理(评估逻辑变更的影响、快速追溯数据来源)，需要构建hive字段级别的数据血缘，hive本身提供提供了一个用于打印数据血缘的钩子类...

4456 4 18
七_seven

IMPALA&HIVE大数据平台数据血缘与数据地图
https://www.freesion.com/article/1176553841/ impala数据血缘与数据地图系列： 1. 解析impala与hive的血缘日志 2...

2193 0 7
一个懒散的人

presto 的安装与使用
相关说明： Presto官网: Presto | Distributed SQL Query Engine for Big Data (prestodb.io)[https:...

2480 0 1
一个懒散的人

Flink 读取Kafka数据
一直以来都是使用spark structstreaming 读取kafka数据，最近一直在尝试用flink读取kafka数据。开发环境配置: kafka + flink +...

2629 0 2