java大数据编程 - 简书

发简信

java大数据编程

0
关注
22
粉丝
19
文章
19070

字数
12

收获喜欢
1

总资产

IP属地：北京

java大数据编程

4.程序控制语句
IF...ELSE 语句简介 Scala IF...ELSE 语句是通过一条或多条语句的执行结果（True或者False）来决定执行的代码块。可以通过下图来简单了...

280 0 0
java大数据编程

3.包和引入
包的作用和定义同java中的包,Scala中的包主要用于大型工程代码的组织同时也解决命名冲突的问题。Scala中的包与java有着诸多的相似之处，但Scala语言中的包更加...

272 0 0

java大数据编程

2.数据类型
简介 Scala的基本数据类型与Java中的基本数据类型是一一对应的，不同的是Scala的基本数据类型头字母必须大写。类型变量定义整数类型变量定义浮点类型变量定义 ...

181 0 0
java大数据编程

1.初识scala
简介 Scala(Scala Language的简称)语言是一种能够运行于JVM和.Net平台之上的通用编程语言，既可用于大规模应用程序开发，也可用于脚本编程。 Sc...

282 0 0
java大数据编程

14.spark mllib之快速入门
简介 MLlib是Spark提供提供机器学习的库，专为在集群上并行运行的情况而设计。MLlib包含很多机器学习算法，可在Spark支持的所有编程语言中使用。 MLlib设计理...

2270 0 1
java大数据编程

13.spark streaming之快速入门
简介 Spark Streaming是Spark核心API的扩展，可以实现可伸缩、高吞吐量、具备容错机制的实时流时数据的处理。支持多种数据源，比如Kafka、Flume、...

821 0 1
java大数据编程

12.spark sql之读写数据
简介 Spark SQL支持多种结构化数据源，轻松从各种数据源中读取Row对象。这些数据源包括Parquet、JSON、Hive表及关系型数据库等。当只使用一部分字...

1178 0 1

java大数据编程

11.spark sql之RDD转换DataSet
简介 Spark SQL提供了两种方式用于将RDD转换为Dataset。使用反射机制推断RDD的数据结构当spark应用可以推断RDD数据结构时，可使用这种方式。...

2034 0 0
java大数据编程

10.spark sql之快速入门
前世今生 Hive&Shark 随着大数据时代的来临，Hadoop风靡一时。为了使熟悉RDBMS但又不理解MapReduce的技术人员快速进行大数据开发，Hive应运而生...

532 0 1
java大数据编程

9.spark core之共享变量
简介 spark执行操作时，可以使用驱动器程序Driver中定义的变量，但有时这种默认的使用方式却并不理想。集群中运行的每个任务都会连接驱动器获取变量。如果获取的变量比...

348 0 0
java大数据编程

JavaScript基础入门教程
概述简介 JavaScript是一种轻量级的脚本语言,是可插入HTML页面的编程代码。JavaScript插入HTML页面后，由所有的现代浏览器执行。组成部分 ECM...

668 0 0
java大数据编程

玩转大数据
磊Ray 编，2922 篇文章，3299 人关注

玩转大数据

java大数据编程

3.spark运行模式
spark支持的运行模式：本地模式、本地集群模式、standalone模式、yarn模式及mesos模式。本地模式 local、local[N]或local[N,maxRe...

831 0 3
java大数据编程

2.spark基本概念
Application 用户编写的Spark应用程序。Application的main方法为应用程序的入口，用户通过Spark的API，定义了RDD和对RDD的操作。 Job...

172 0 0
java大数据编程

1.spark简介
spark是一个用于大规模数据处理的统一计算引擎。适用于各种各样原先需要多种不同的分布式平台处理的场景，包括批处理、迭代计算、交互式查询、流处理。通过统一的框架将各种处理流程...

450 0 0
java大数据编程

8.spark core之读写数据
spark支持多种数据源，从总体来分分为两大部分：文件系统和数据库。文件系统文件系统主要有本地文件系统、Amazon S3、HDFS等。文件系统中存储的文件...

934 0 3
java大数据编程

@IT·大数据
全能程序猿编，203 篇文章，281 人关注

个人网站 : http://www.xcan.top 个人店铺: 鞋盒: https://shop117015562.taobao.com/ 男装: https://shop469108515.taobao.com/ Hadoop,Hbase,Hive,Spark,Apache Kafka,Apache Storm,Map reduce,SQOOP,Zookeeper

java大数据编程

大数据爬虫Python AI Sql
好香帅编，2262 篇文章，4318 人关注

大数据，数据库，AI, sql等
java大数据编程

大数据
磊Ray 编，4873 篇文章，9809 人关注

大数据，收录大数据相关技术的文章。
java大数据编程

7.spark core之数据分区
简介 spark一个最重要的特性就是对数据集在各个节点的分区进行控制。控制数据分布可以减少网络开销，极大地提升整体性能。只有Pair RDD才有分区，非Pair RD...

1023 0 1

个人介绍

专注java大数据开发编程，忠于技术，热爱分享。欢迎关注个人公众号：java大数据编程。