aggregate_metric_double是ES引入的一种新的字段类型,功能比较简单,但是在时序场景非常好用,本篇文章简单介绍下这个特性。
aggregate_metric_double是直接写入已经按max、min、sum、avg、count聚合好的数据。这样对这个字段进行max、min、sum、avg、count聚合的时候,不再需要实时计算,直接使用聚合的结果即可。
aggregate_metric_double的使用可以参看官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/8.6/aggregate-metric-double.html
简单看下使用方式,创建一个aggregate_metric_double类型字段的索引:
{
"mappings": {
"properties": {
"agg_metric": {
"type": "aggregate_metric_double",
"metrics": [ "min", "max", "sum", "value_count" ],
"default_metric": "max"
}
}
}
}
这里字段需要写入"min", "max", "sum", "value_count"四个结果。
然后default_metric配置为max,这里说的是如果不是进行max、min、sum、avg、count聚合,agg_metric字段默认使用max的value。
写入数据示例如下:
PUT stats-index/_doc/1
{
"agg_metric": {
"min": -302.50,
"max": 702.30,
"sum": 200.0,
"value_count": 25
}
}
查询时,直接对agg_metric执行进行查询即可:
POST stats-index/_search?size=0
{
"aggs": {
"metric_min": { "min": { "field": "agg_metric" } },
"metric_max": { "max": { "field": "agg_metric" } },
"metric_value_count": { "value_count": { "field": "agg_metric" } },
"metric_sum": { "sum": { "field": "agg_metric" } },
"metric_avg": { "avg": { "field": "agg_metric" } }
}
}
这里可以看到,写入的时候不需要写入avg value,因为avg value会通过sum/value_count计算得到。
aggregate_metric_double功能实现也比较简单,具体实现在x-pack-aggregate-metric插件中。
主要功能是在AggregateDoubleMetricFieldMapper中实现。AggregateDoubleMetricFieldMapper会为每个metric保留一个NumberFieldMapper。AggregateDoubleMetricFieldMapper在写入时,进行字段解析,然后将对应的字段写入对应的NumberFieldMapper中。
查询时的实现方式是扩展了Aggregator的实现,分别实现了max、min、sum、avg、count的Aggregator。
然后将这些Aggregator注册,一个示例如下:
public static void registerSumAggregator(ValuesSourceRegistry.Builder builder) {
builder.register(
SumAggregationBuilder.REGISTRY_KEY,
AggregateMetricsValuesSourceType.AGGREGATE_METRIC,
AggregateMetricBackedSumAggregator::new,
true
);
}
这样在进行Sum Aggregation的时候,发现是对aggregate_metric_double的字段进行Aggregation,就会调用到AggregateMetricBackedSumAggregator进行计算,AggregateMetricBackedSumAggregator实现了从aggregate_metric_double从获取sum类型对应的value,进行sum运算,就能完成对应需求。
另外由于aggregate_metric_double支持default_metric,所以aggregate_metric_double还能支持一些基础的query功能,包括:exists、range、term、terms。实现方式就是使用default_metric对应的索引字段,比如对termQuery的支持如下:
@Override
public Query termQuery(Object value, SearchExecutionContext context) {
if (value == null) {
throw new IllegalArgumentException("Cannot search for null.");
}
return delegateFieldType().termQuery(value, context);
}