6篇文章 · 14179字 · 3人关注
最佳的复制一个partitioned表的步骤: 创建新的目标,跟旧表一样的schema. 如:create table new_xx like ...
github链接 针对Hive的优化主要有以下几个方面: map reduce file format shuffle & sort job a...
Spark A. 小文件过多 解决方法:使用 SparkContext下newAPIHadoopFile完成数据输入,指定org.apache....
HDFS A. ha dfs 初始化和启动 启动zookeeper集群 在主Name结点上 格式化zookeeper上相应目录hdfs zkfc...
添加DataNode 对于新添加的DataNode节点,需要启动datanode进程,从而将其添加入集群 在新增的节点上,运行sbin/hado...
HDFS hadoop 的基础分布式文件存储系统,分为NameNode和DataNode.NameNode负责存储文件系统的metadata,管...
文集作者