• 120
    数据治理篇-数据质量-数据模式: avro概述

    前言 前面几篇讲过,元数据侧重于配置【驱动】编程的思想,通过建立统一的数据资产,进一步【驱动】企业数字化升级。 但数字化升级是个战略性的目标,短期内效果并不明显,甚至很多时候...

  • 120
    离线计算——聊一聊我所经历的计算框架

    上篇讲了存储:MySQL、HBase、ES的特点和区别。数据时代只有数据的存储当然不够,如何从数据中获取业务需要的信息才能创造价值,这类工作就需要计算框架来完成,现在就来聊一...

  • 120
    实时计算——聊一聊我所经历的计算框架

    实时计算 上篇文章大致介绍了离线计算MapReduce和Spark,但是无法满足对实时性要求较高的业务,下面我们来了解一下实时计算。 离线和批量、实时和流式 在聊实时计算之前...