ElasticSearch中的关于对象数组查询,请注意要正确使用Nested类型

ElasticSearch中的关于对象数组查询,请注意要正确使用Nested类型,使用不当会导致检索时结果不正确。

直接上Demo演示

假设张三和李四分别喜欢喝某品牌的啤酒,青岛(黑啤和白啤)燕京(黑啤和白啤)

curl -X PUT 'http://localhost:9200/my-index-test001/_doc/1' -H 'Content-Type: application/json' -d '
{
  "id" : "1",
  "name": "张三",
  "favoriteBeers" : [ 
    {
      "brand" : "青岛",
      "type" :  "黑啤"
    },
    {
      "brand" : "燕京",
      "type" :  "白啤"
    }
  ]
}'

curl -X PUT 'http://localhost:9200/my-index-test001/_doc/2' -H 'Content-Type: application/json' -d '
{
  "id" : "2",
  "name": "李四",
  "favoriteBeers" : [ 
    {
      "brand" : "青岛",
      "type" :  "白啤"
    },
    {
      "brand" : "燕京",
      "type" :  "黑啤"
    }
  ]
}'

要查询喜欢喝青岛白啤的用户

curl -X GET 'http://localhost:9200/my-index-test001/_search?pretty=true' -H 'Content-Type: application/json' -d '
{
  "query" :{
    "bool":{
      "must":[
        {"match": {"favoriteBeers.brand": "青岛"}},
        {"match": {"favoriteBeers.type": "白啤"}}
      ]
    }
  }
}'

查询结果如下:

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 0.7976569,
    "hits" : [
      {
        "_index" : "my-index-test001",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.7976569,
        "_source" : {
          "id" : "1",
          "name" : "张三",
          "favoriteBeers" : [
            {
              "brand" : "青岛",
              "type" : "黑啤"
            },
            {
              "brand" : "燕京",
              "type" : "白啤"
            }
          ]
        }
      },
      {
        "_index" : "my-index-test001",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.7976569,
        "_source" : {
          "id" : "2",
          "name" : "李四",
          "favoriteBeers" : [
            {
              "brand" : "青岛",
              "type" : "白啤"
            },
            {
              "brand" : "燕京",
              "type" : "黄啤"
            }
          ]
        }
      }
    ]
  }
}

我们预想中,这个检索应该只能检索出李四,但是结果是张三也被匹配到了?为什么呢?

前面张三的文档将在内部转换为看起来更像这样的文档:

{
  "name" :        "张三",
  "favoriteBeers.brand" : [ "青岛", "燕京" ],
  "favoriteBeers.type" :  [ "黑啤", "白啤" ]
}

那我们该怎么做呢?

很简单,ElasticSearch官方告诉我们,将nested字段用于对象数组即可。

如果需要索引对象数组并保持数组中每个对象的独立性,请使用nested数据类型而不是object数据类型。

我们先将这条索引删除,重新定义mapping映射文件:

curl -X DELETE 'http://localhost:9200/my-index-test001'
curl -X PUT 'http://localhost:9200/my-index-test001?pretty' -H 'Content-Type: application/json' -d '
{
  "mappings": {
    "properties": {
      "id": {
        "type": "keyword"
      },
      "name": {
        "type": "keyword"
      },
      "favoriteBeers": {
        "type": "nested",
        "properties": {
          "brand": {
            "type": "keyword"
          },
          "type": {
            "type": "keyword"
          }
        }
      }
    }
  }
}'

重新索引之前的张三、李四

请注意这个新查询,相应要增加nested path

curl -X GET 'http://localhost:9200/my-index-test001/_search?pretty=true' -H 'Content-Type: application/json' -d '
{
  "query" : {
    "bool": {
      "must":[
        {
          "nested":{
            "path":"favoriteBeers",
            "query":{
              "bool":{
                "must":[
                  {"match":{"favoriteBeers.brand":"青岛"}},
                  {"match":{"favoriteBeers.type":"白啤"}}
                ]
              }
            }
          }
        }
      ]
    }
  }
}'

得到正常结果:

{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.3862942,
    "hits" : [
      {
        "_index" : "my-index-test001",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 1.3862942,
        "_source" : {
          "id" : "2",
          "name" : "李四",
          "favoriteBeers" : [
            {
              "brand" : "青岛",
              "type" : "白啤"
            },
            {
              "brand" : "燕京",
              "type" : "黄啤"
            }
          ]
        }
      }
    ]
  }
}

参考文档:
https://www.elastic.co/guide/en/elasticsearch/reference/current/nested.html

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351

推荐阅读更多精彩内容