Hadoop之旅 - 文集

Hadoop之旅

6篇文章 · 14179字 · 3人关注

5. Hadoop之旅——Hive使用篇(二)
最佳的复制一个partitioned表的步骤：创建新的目标，跟旧表一样的schema. 如：create table new_xx like ...

2375 0 3
5. Hadoop之旅——Hive使用篇
github链接针对Hive的优化主要有以下几个方面： map reduce file format shuffle & sort job a...

0.1 6169 2 33 2

4. Hadoop之旅——使用篇
Spark A. 小文件过多解决方法：使用 SparkContext下newAPIHadoopFile完成数据输入，指定org.apache....

1271 0 2
3. Hadoop之旅——运维篇
HDFS A. ha dfs 初始化和启动启动zookeeper集群在主Name结点上格式化zookeeper上相应目录hdfs zkfc...

0.1 1830 0 5 1
2. Hadoop之旅——集群篇
添加DataNode 对于新添加的DataNode节点，需要启动datanode进程，从而将其添加入集群在新增的节点上，运行sbin/hado...

691 0 0
1. Hadoop之旅——环境生态篇
HDFS hadoop 的基础分布式文件存储系统，分为NameNode和DataNode.NameNode负责存储文件系统的metadata，管...

1090 0 1