open-falcon配置flume监控 官方文档:http://book.open-falcon.org/zh_0_2/usage/flume...
背景 需要收集公司的app/web端埋点日志,需要搭建一套日志收集系统 采用 apache-flume-1.9.0版本; 服务器是AWS的裸机服...
面试被问到Azkaban的job历史信息存在那张表中 概述 Azkaban3 共 15 张表,分别用于存储任务调度,定时任务,触发器,项目 Pr...
数仓--Hive-面试之Hive与HBase的区别数仓--Hive-面试之Hive架构原理数仓--Hive-面试之Hive的数据模型及各模块的应...
数据准备 分析 pv1: 分组内从起点到当前行的pv累积,如,11号的pv1=10号的pv+11号的pv, 12号=10号+11号+12号 pv...
既然是手写代码,那么就需要会手写,手写这个是重点 1-请详细描述将一个有结构的文本文件student.txt导入到一个hive表中的步骤,及其关...
面试如果被问道,那么需要说出彩来,特别时参数 Hive动态分区参数配置 往hive分区表中插入数据时,如果需要创建的分区很多,比如以表中某个字段...
Hive向程序中传递变量的方式 暴力替换字符串替换正则替换模板引擎 系统环境变量shell环境变量:${env:varname}system系统...
Hive的优化策略大致分为:配置优化(hive-site.xml和hive-cli执行前配置)、表优化、hive数据倾斜解决方案。回答的时候需要...
文集作者