CPU架构分类 从CPU发明到现在,有非常多种架构,从我们熟悉的X86,ARM,到不太熟悉的MIPS,IA64等 X86架构来由 IBM 开始做...
HBase的部署方式包括: HBase的安装 本文的HBase安装是在Hadoop已经安装好的基础上实现的,所以之前要导出JAVA_HOME、H...
概述 官方地址http://kafka.apache.org/快速入门教程:http://kafka.apache.org/quickstart...
Hive有三种复杂数据类型ARRAY、MAP 和 STRUCT。ARRAY和MAP与Java中的Array和Map类似,而STRUCT与C语言中...
以列的(列名,列的类型。列值)的形式构成的分布式数据集,按照列赋予不同名称,约等于关系数据库的数据表 A DataFrame is a Data...
序列化 把内存中对象转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输 反序列化 接收到的字节序列或者其他传输协议或者是磁...
概述 机器学习是用数据或以往的经验,并以此来优化程序的性能指标。机器学习本质思想:使用现有的数据,训练出一个模型,然后在用这个模型去拟合其他的数...
环境变量配置 环境变量生效 HDFS 测试Hadoop自带的wordcount 修改hadoop-env.sh配置文件。echo $JAVA_H...
利用反射机制推断RDD 在利用反射机制推断RDD模式时,需要首先定义一个case class,因为,只有case class才能被Spark隐式...