240 发简信
IP属地:湖北
  • 120
    hive面试问题

    0x00 什么是hive hive是构建在hadoop之上的数据仓库组件,是目前大数据领域最常用的数据仓库开源实现框架,hive定义了一种类sql语言,称为hql,hive能...

  • 120
    hadoop面试问题

    hadoop面试问题,不定期更新 0x00 什么是hadoop 我们通常说的hadoop有两种意思,一种是hadoop生态圈,包含hadoop、hive、hbase等组件,另...

  • 120
    数据仓库问题

    整理的数仓的一些基本问题,不定期更新 0x01 什么是数据仓库 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合 数据仓库是将源系统数据抽取、转化、清洗,...

  • 第一周 描述性统计

    0x00 前言 参加居士的数据挖掘学习小组,按周产出笔记,这周的学习内容是 【数据的描述性统计】,按照居士的推荐,学习资料主要是【人人都会数据分析这本书】,这周的学习内容主要...

  • 队列

    0x00 基本概念 和栈一样,队列也是一种受操作限制的线性表,和栈相反的是队列是先进先出,最基本的操作也是两个,入队和出队。 队列应用非常广泛,特别是一些具有额外特性的队列,...

  • 0x00 栈 栈是一种操作受限的线性表,只允许一端插入和删除数据,相比数组和链表,栈的操作只有限制 事实上,在功能上数组和链表确实可以替代栈,栈的底层一般也是数组或链表实现的...

  • 链表2 - 写链表代码的技巧

    0x00 前言 专栏这一讲主要讲解写链表代码的一些技巧,就我的经验来说,链表代码写起来很麻烦,主要是链表的指针指来指去就会变得很混乱,还有就是边界问题的处理,使得链表的处理很...

  • 链表

    0x01 链表结构 与数组相反,链表通过指针将一组零散的内存串联起来使用 常见有三种链表:单链表、双向链表、循环链表 单链表 单链表只有一个方向,每个链表元素包含数据和一个指...

  • 数组

    0x00 数组 数组时一种线性表结构,用一组连续的内存空间,来存储一组具有相同类型的数据 1、线性表 顾名思义就是数据排列成一条线一样的结构,每个数据最多只有前和后两个方向,...

  • 维度建模

    0x00 前言 我们知道维度建模是使用一致性维度来串联整个数据仓库,按照kimball的维度建模理论,维度模型设计主要有4个步骤 选择业务过程 声明粒度 确认维度 确认事实 ...

  • 复杂度分析

    0x00 复杂度分析 数据结构和算法本身解决的是‘快’和‘省’的问题,即如何让代码运行得更快,如何让代码更省存储空间,所以如何衡量算法的执行效率就至关重要,这就是我们要学习的...

  • 开篇

    最近在学习极客时间的专栏《数据结构与算法之美》,通过写博客笔记的方式记录并激励自己学习 定义 从广义上来说: 数据结构就是指一组数据的存储结构,算法就是操作数据的一种方法 从...

  • 数据仓库建模

    1、前言 从各个业务线的数据到运营决策的报表,数据在流转过程中,如何安全、高效、准确的流转,这是数据仓库需要解决的问题。 关于建模的方式主要有两种流派,分别有两本书 1、in...

  • 开篇

    1、前言 我从15年开始接触大数据,之前做过一段时间javaweb开发,呆了几家小公司,做过一些方案调研、hadoop环境搭建维护、etl方面的工作,18年到现在的公司,接触...