IP属地:贵州
spark
1、RDD <--> DataFrame 2、RDD <-> DataSet 3、DataFrame <-> DataSet
决策树算法 数据集是某学校男性女性的身高体重信息。数据说明: height 身高 、weight 体重 、category 0男1女 、ra...
DriverProgram 就是程序员所设计的 Spark 程序,在 Spark 程序中必须定义 SparkContext,它是开发 Spark...
Apache Maven is a software project management and comprehension tool. Ba...
知识点 线性回归 最小二乘法 随机梯度下降 逻辑回归 正则化 保序回归 spark官方提供的回归、分类算法:Linear models (SVM...
用途:数据挖掘、日志分析、商务智能、搜索引擎..... 官网介绍:The Apache™ Hadoop® project develops op...
使用的数据集是tpch工具生成的数据集,存放在hive中,关于相关的细节,请看//www.greatytc.com/p/154069c...
我的hadoop版本:hadoop-2.6.0-cdh5.7.0我的scala版本:2.11.8我的hive版本:hive-1.1.0-cdh5...