Spark Streaming 编程指南1.概述Spark Streaming 是 Spark Core API 的扩展, 它支持弹性的, 高吞...
收录了8篇文章 · 2人关注
Spark Streaming 编程指南1.概述Spark Streaming 是 Spark Core API 的扩展, 它支持弹性的, 高吞...
本文讲述在一台Centos7笔记本中安装Spark standalone(spark运行需要jdk、scala和spark)和如何提交一个简单的...
入门五步走 第一步 安装hadoop集群 1、安装jdk,当前为jdk8,jdk9、10、11由于会移除一些类,导致hadoop集群安装失败安装...
目录 1、利用Binlog和Kafka实时同步mysql数据到Elasticsearch(一) - 开启Binlog日志2、利用Binlog和K...
为什么需要列式存储 相对于传统型数据库行式存储而言,区别如下 行式存储,存储一个表,通过行的序列构成 列式存储,存储一个表,通过列的序列构成 例...
最近看到一篇很好资料,里面三言两语配上几个图就把列式存储(Column-based Storage)讲明白了,牛啊!最喜欢的就是这种浅显易懂就把...
1. schema 注册表 无论是使用传统的Avro API自定义序列化类和反序列化类还是使用Twitter的Bijection类库实现Avro...
1 项目介绍2 涉及的技术3 推荐流程图4 收获5 问题 1 项目介绍 使用Spark框架实现电影推荐系统; 运用数据挖掘的算法产生模型,为用户...
专题公告
大数据相关技术