0 简介 在日常的数据分析中,分位数 是非常重要的一环,在探查数据分布,定义指标中都必不可缺。但 python 里的分位数计算却潜藏了一些坑点,...
0 前言 数据分析师在使用python进行数据分析时,经常会遇到 Nan 和 None 这两个数据缺失值,但它们两并不互相等价,有很多细微的差别...
数据分析的点、线、面 前言 在告别了人口红利之后,对于成熟或平台型产品而言,增长的核心不再是对增量用户的扩张,而是对存量用户的精细化运营,提升转...
前言 在日常工作中,数据同学经常会遇到以下问题 产品:为什么A页面的数据和B页面的数据对不上数据:我去看看一段时间后.....数据:A页面数据是...
前言 支架表是维度设计中非常有意思的一部分,可以说是星型模型和雪花模型的结合;但在大部分维度建模书里都只是简单的一笔带过,实在是过于可惜。 在本...
前言 在大部分的公司里,数据部门的产出主要都是提取数据和 数据可视化(BI);提数工作无需多说,写好SQL即可。但BI则不同,即使在BAT等非常...
前言 ETL 开发是数据工程师必备的技能之一,在数据仓库、BI等场景中起到重要的作用。但很多从业者连 ETL 对应的英文是什么都不了解,更不要谈...
引言 元数据管理是企业数据治理的基础,是数据仓库的提升;作为一名数据人,首要任务就是理解元数据管理。本篇文章将为大家梳理元数据的概念,介绍元数据...
引言 本文主要面向对象是,对BI完全不了解,或只是初步了解的人。从宏观角度介绍了BI的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有...