240 发简信
IP属地:广东
  • Hive注释中文乱码

    创建表的时候,comment说明字段包含中文,表成功创建成功之后,中文说明显示乱码 创建完成后查看 这是因为在MySQL中的元数据出现乱码 针对...

  • Kafka Manager安装

    Kafka Manager安装 1.sbt安装 官方安装说明 验证安装 2.Kafka Manager安装 获取安装包 GitHub地址 解压安...

  • hadoop小文件问题

    文档目录 什么是小文件 小文件产生的原因 小文件引起的问题 小文件解决方案 如何选择小文件解决方案 什么是小文件 小文件的定义和hadoop中...

  • Resize,w 360,h 240
    安装扩展包(Install External Libraries)

    在CDH平台上为Streamsets导入扩展包前, 先设置一个用来存储这些扩展包的目录 在Cloundera管理平台界面中, 选择StreamS...

  • Resize,w 360,h 240
    StreamSets update和delete分离之后导致的操作顺序错乱

    现象: 当期的操作流程如下图: 这样的处理流程会造成如下问题: 1、当binlog解析出的批次数据中,数据包含了对同一条数据的删除和修改操作时,...

  • Resize,w 360,h 240
    otter基础

    一、otter介绍 阿里巴巴B2B公司,因为业务的特性,卖家主要集中在国内,买家主要集中在国外,所以衍生出了杭州和美国异地机房的需求,同时为了提...

  • hive 优化

    原文地址 Apache Hive是一个类似SQL的软件,与Hadoop一起使用,使用户能够快速高效地使用自己的语言HiveQL执行类似SQL的查...

  • Flume基础案例

    核心概念 Agent:使用JVM 运行Flume。每台机器运行一个agent,但是可以在一个agent中包含多个sources和sinks。Cl...

  • Resize,w 360,h 240
    spark 内存管理

    内容目录 JVM 內存使用架构剖析 Spark 1.6.x以前版本内存管理 Spark on Yarn 计算内存使用案例 Spark Unifi...