240 发简信
IP属地:辽宁
  • Resize,w 360,h 240
    Mac 在IDEA 部署flink 并编写第一个流式WordCount程序

    1、环境配置 Java 环境配置:https://www.runoob.com/java/java-environment-setup.html...

    0.2 1080 2
  • hive 优化方案

    目前越来越多的公司开始基于Hive搭建数据仓库,所以本文主要针对Hive介绍几种优化方式。尽管Hive已经做了很多原生的优化工作,但是仍然有优化...

  • 数据仓库值事实表基础

    事实表基本结构 操作性事件中产生的可度量数值,存储在事实表中,事实表肯定会包含外键,用来与维度表进行关联,也包含可选的退化维度键和日期/时间戳。...

  • 数据仓库之高级事实表

    事实表代理键 代理键可用作所有维度表的主键。不与任何维度关联的事实表代理键,是在ETL加载过程中顺次分配的,可用于作为事实表的唯一主键列;在ET...

  • 无监督的神经网络模型-自编码器

    自编码器(简称AE)是一种无监督的神经网络模型,最初的AE是一个三层的前馈神经网络结构,由输入层、隐藏层和输出层构成,其核心的作用是能够学习到输...

  • 缓慢变化维的类型以及处理方式

    类型0:原样保留 对维度属性值不会发生变化的,事实表以原始值分组。例如持久型标识符和日期维度的大多数属性 类型1:重写 维度行中原来的属性值被新...

  • 深度神经网络的优化和训练的难点

    反向传播算法仍然是当前深度神经网络最受欢迎的模型最优化方法。 反向传播 反向传播有前向和后向两个操作构成,前向操作利用当前的权重参数和输入数据,...

  • 维度建模的流程

    一、收集业务需求和数据实现 开始维度建模工作前,需要理解业务需求,以及作为基础的源数据的实际情况。通过与业务代表交流来发现需求,用于理解他们的基...

  • 深度学习之时间递归神经网络

    递归神经网络(RNN)分别是时间递归神经网络和结构递归神经网络。本文主要介绍时间递归神经网络。 Elman递归神经网络 前馈神经网络将信息从输入...