什么是标签? 标签是一种数据特征。比如用户的年龄、性别、地区等。 这些特征在数据中具有一定的通用性和价值。 为什么说是“一种”数据特征呢,因为针对的目标不同,会有不同的标签,...
![240](https://cdn2.jianshu.io/assets/default_avatar/4-3397163ecdb3855a0a4139c34a695885.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
什么是标签? 标签是一种数据特征。比如用户的年龄、性别、地区等。 这些特征在数据中具有一定的通用性和价值。 为什么说是“一种”数据特征呢,因为针对的目标不同,会有不同的标签,...
一、已知 二、猜测 首先定位到代码如下: 1.首先排查是否代码有更新看git提交记录,发现代码最近一次更新是在2016年。所以不可能是更新代码导致的。 2.怀疑是重启过后,消...
一.概述 随着物联网IOT时代的来临,IOT设备感知和报警存储的数据越来越大,有用的价值数据需要数据分析师去分析。大数据分析成了非常重要的环节。当然近两年开启的开源大潮,为大...
一、Redis基础简介 1、Redis官方介绍 Redis是一个开源(BSD许可),内存数据结构存储,用作数据库,缓存和消息代理。它支持数据结构,如字符串,散列,列表,集合,...
Spark SQL读取MySQL的方式 Spark SQL还包括一个可以使用JDBC从其他数据库读取数据的数据源。与使用JdbcRDD相比,应优先使用此功能。这是因为结果作为...
Spark Streaming No Receivers 方式的createDirectStream 方法不使用接收器,而是创建输入流直接从Kafka 集群节点拉取消息。输入...
一、hive为我们提供的函数 hive给我们提供了一些内置函数,比如截取字符串,大小写转换此处距离substr 1、首先模仿sql建立一个伪表dual 2、准备数据 在本地创...
以下是在学习和使用spark过程中遇到的一些问题,记录下来。 1、首先来说说spark任务运行完后查错最常用的一个命令,那就是把任务运行日志down下来。 程序存在错误,将日...
1、在 bash shell 中,$()是将括号内命令的执行结果赋值给变量: 2、${} 是用来作变量替换。一般情况下,$var 与 ${var} 并没有啥不一样。但是用 $...
基于flink-1.8.1 本文转载自一文搞懂Flink内部的Exactly Once和At Least Once 如何理解flink中state(状态) state泛指 s...
[TOC] 参考 B树、B+树、LSM树以及其典型应用场景B树和B+树的插入、删除图文详解BTree vs LSM 0. 前言 动态查找树主要有:二叉查找树、平衡二叉树、红黑...
团队内部要分享HBase的知识,之前研究了一段时间,知识比较零散,这一次就系统化的整理一番,之后在想到Hbase的时候,看着一篇就够了。 阿里陶系技术部招人,目前大把机会,H...
本文将列出一些常见的区别与联系基本的区别 在Scala中方法不是值,而函数是。所以一个方法不能赋值给一个val变量,而函数可以。 在这个例子中定义了一个方法increment...