240 发简信
IP属地:山西
  • Hive Hooks介绍

    Hive作为SQL on Hadoop最稳定、应用最广泛的查询引擎被大家所熟知。但是由于基于MapReduce,查询执行速度太慢而逐步引入其他的...

  • Resize,w 360,h 240
    [Python实战] 功能简单的数据查询及可视化系统

    前言 数据时代,数据的多源集成和快速检索查询是第一步,配上数据分析及可视化才能算窥得大数据一角。 创建这个项目的主要目的一是对前期工作的一些总结...

  • SQL优化器简介

    文章导读: 什么是RBO? 什么是CBO? 我们在工作中经常会听到这样的声音:“SQL查询慢?你给数据库加个索引啊”。虽然加索引并不一定能解决问...

  • Apache Calcite简介

    文章导读: 什么是Calcite? Calcite的主要功能? 如何快速使用Calcite? 什么是Calcite Apache Calcite...

  • Resize,w 360,h 240
    初识大数据

    最近几年IT技术的发展真的是日新月异,什么云计算、大数据、机器学习、AI等等名词层出不穷。多数程序员内心其实是恐慌的,我也时常会感到危机感。每每...

  • 运维工具SaltStack简介

    当我们决定要自己动手做一个Hadoop生态集群管理服务的时候我们已经入了运维的坑了。如果我们对于Hadoop生态集群管理服务到底有哪些功能,应该...

  • 简单分析Ambari——顶级Hadoop管理方案

    前面我们提到了两个比较火的Hadoop集群运维管理工具 Ambari和Cloudera Manager。它们集安装,配置,监控于一身,对于Had...

  • 运维管理Hadoop生态集群工具比较

    现在想学习大数据肯定学习Hadoop,每个新手在学习Hadoop的时候都需要去安装一个属于自己的测试环境才能开始愉快的玩耍。但是Hadoop的发...

  • HBase 2.0 你应该了解的新特性

    2018年4月30日HBase发布了2.0的Release版本。HBase的2.0版本承载了太多的Features,共包含4551个Issues...