集 和 组是tableau数据分析中常用的功能,在很多案例分析和教程里我们都能看到它们的踪影,特别是 集 配合筛选器、参数等功能,能够实现很多令人惊叹的效果。
集和组都是Tableau中进行数据处理、数据区分、数据筛选的重要功能。本文我们简单介绍Tableau中的集(set)和组(group)的区别与作用。
集的官方定义:
集(Set),是根据某些条件定义数据子集的自定义字段
组的官方定义:
组(group)通过将大量维度成员组合到更高级别的类别中,来简化大量维度成员
**一、集 和 组的创建 **
一般常规创建集 或 组 的方法有两种
** 1、维度字段上右键 - 创建 - 集/组**
2、视图上直接创建
在需要分组的视图中,按住Ctrl多选需要分组的项目成员,选中后会自动弹出下图中的快捷框,点击箭头标识的创建集 或 组
从标识上我们可以看到,''曲别针"形状的是 组,文氏图形状的是 集 。
二、集 和 组的区别
集和组他们的区别有很多。
1、从表现形式上来看:
集(Set)的效果,其划分结果只有两种,in 或者 out ,也就是内 和外 ,符合条件的是内,其余是外。
组(group)的效果,是根据需要将不同维度聚合起来,组可以有多个。
比如我们可以按照 物品的体积将子类别再分成大、中、小型用品。
2、从功能用途上去区分:
集可以参与到计算当中,你可以理解为它是一种二分类数据或者布尔型数据。
组是维度的进一步聚合,它不可以用于计算。
3、从成员设置创建上去区分:
集的创建 除了我们手动选择成员,还可以通过 条件和排序去进行设置
而组只能手动选择成员。
按条件创建集:
按排序创建集:
**三:集和组的主要使用场景 **
集(set)在日常使用中有着较多的使用场景。下面我们列举几种常用的 集的使用。
**1、用作数据标记 **
上面介绍到,集是一种二分类的数据形式。我们可以通过 创建集的形式轻易的标记出我们要重点关注的数据。
如:我们想将利润率大于 10 % 的子类别产品标记出来。
首先:子类别创建一个 集【利润率大于10%】
将新建的 集 拖入标记功能区颜色。我们可以很容易看到哪些是利润率比较高的子类别。
**2、用做筛选器 **
毫无疑问,我们除了用【集】来标记数据,也可以将集用作筛选器,用于筛选出我们关注的数据集。
3、使用集来当维度字段。
这一作用和 组(group) 很像。虽然 集 只是二分类数据,但是依然不妨碍它本身是维度数据这一特征。
**4、用于计算字段 **
上文介绍过,集可以用于计算字段中。由于集的二分类特征,它可以用于充当判断逻辑,来用于计算字段中判断是否在集内。
比较经典的有 使用集来选择 TOPN 和 其他 数据 。如下动图所示
由于使用场景较为丰富,这一部分笔者准备下篇文章进行单独介绍。
组 的使用场景 :
上文有介绍,组主要是将大量维度进行进一步聚合,这基本上就是组(group)的主要功能。 笔者不再过多赘述。
下篇文章我们会对 集在计算字段中的使用及功能做进一步介绍。
如果本文对你有所帮助,欢迎点赞关注。谢谢大家。