ES使用遇到的问题

最近在做一个微服务项目,项目中基本用Redis和ES替代了Mysql,Mysql更像是一个备份。但是在开发中我遇到了一个ES查询问题——ES的嵌套查询。项目中存在一对多的关系,使用Mysql只要关联查询就行了,但是改用ES之后一直没能直接实现我的需求,最后还是没有解决我的问题,下面就简单梳理一下。因为最近好几个小伙伴问怎么搭梯子,所以最后会附上一个搭建梯子教程。
还是使用spring boot来整合ES,我根据项目的需求自己简单的创建一个项目,一个一对多的查询。
首先创建ES一个document(和Mysql的model基本一样),代码如下:

@Document(indexName = "team_index",type = "team_type", shards = 2, replicas = 1,createIndex = false)
public class TeamType {
    
    @Id
    @Field(type = FieldType.Keyword, store = true)
    private String id;

    @Field(type = FieldType.Keyword, store = true)
    private Long teamId;

    @Field(type = FieldType.Nested, store = true)
    private List<MemberType> memberTypes;

    @Field(type = FieldType.Keyword, store = true)
    private String skuCode;

    @Field(type = FieldType.Keyword, store = true)
    private String ownerId;

    @Field(type = FieldType.Keyword, store = true)
    private String status;

    @Field(type = FieldType.Integer, store = true)
    private Integer needAmount;
    // 省略部分字段
    ......
}

// MemberType
public class MemberType {

    @Id
    @Field(type = FieldType.Keyword, store = true)
    private String id;
    
    @Field(type = FieldType.Keyword, store = true)
    private String teamId;

    @Field(type = FieldType.Keyword, store = true)
    private String userId;

    @Field(type = FieldType.Boolean, store = true)
    private boolean captain;

    @Field(type = FieldType.Keyword, store = true)
    private String orderId;
    // 省略部分字段
    ......
}

根据代码就可以看出在TeamType内嵌套了一个MemberType列表,这是一个很简单的一对多的关系。现在我的需求是这样的我需要先对TeamType进行一次过滤查询出满足条件的对象,然后还需要对TeamType内部的MemberType也进行一个过滤。

1、创建索引,添加数据

首先我启动ES和kibana,然后通过调用接口方式创建索引并做好映射关系,当然也可以通过直接操作ES完成,不过既然是项目中使用我觉得自己写个接口调用一下更方便一点,首先是创建索引:

    public Map<String, Object> addIndex() {
        Map<String,Object> resultMap = new HashMap<>();

        if (elasticsearchTemplate.indexExists("team_index")) {
            elasticsearchTemplate.deleteIndex("team_index");
        }
        elasticsearchTemplate.createIndex("team_index");
        elasticsearchTemplate.putMapping(TeamType.class);
        elasticsearchTemplate.refresh(TeamType.class);

        resultMap.put("success",true);
        resultMap.put("message","创建索引成功");
        return resultMap;
    }

接下来就是将数据从数据库的数据存放到ES。在数据库中我的Team和Member是分表存放的,二者通过Team的主键进行关联。而在ES中只有TeamType一个类型,所以查询从数据库查询出数据后需要自己拼装一下。因为整个业务很简单,封装这一点也比较简单,先从数据库查询所有Team,然后遍历查询所有的Member即可(或者使用之前说过的Mybatis一对多查询),代码如下:

    public void addDataToES() {
        List<Team> teamList = teamRepository.findAll();

        for(Team team : teamList) {
            List<Member> memberList = memberRepository.queryAllByTeamId(team.getId());
            List<MemberType> memberTypeList = toTypeList(memberList);

            TeamType teamType = new TeamType(team,memberTypeList);
            teamTypeRepository.save(teamType);
            teamTypeRepository.refresh();
        }
    }

现在索引建了、数据也存放了,接下来就是查询

2、使用ES查询

首先通过使用kibana来查询,看下ES中的数据是否完整,

GET team_index/_search
{
  "query": {
    "match_all": {}
  }
}

因为数据比较少,所以就贴提下查询的结果:

{
  "took": 62,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 1,
    "hits": [
      {
        "_index": "team_index",
        "_type": "team_type",
        "_id": "2",
        "_score": 1,
        "_source": {
          "id": "2",
          "teamId": 2,
          "memberTypes": [
            {
              "id": "5",
              "teamId": "2",
              "userId": "U22222222",
              "captain": false,
              "orderId": "O888888888",
              "createTime": "2019-07-09T05:18:00.303+0000",
              "updateTime": "2019-07-09T05:18:09.365+0000"
            },
            {
              "id": "4",
              "teamId": "2",
              "userId": "U11111111",
              "captain": false,
              "orderId": "O999999999",
              "createTime": "2019-07-09T05:17:34.585+0000",
              "updateTime": "2019-07-09T05:17:46.820+0000"
            }
          ],
          "skuCode": "8887545454514",
          "ownerId": "U00000001",
          "status": "success",
          "needAmount": 6,
          "createTime": "2019-07-09T05:18:56.112+0000",
          "updateTime": "2019-07-09T05:19:16.234+0000"
        }
      },
      {
        "_index": "team_index",
        "_type": "team_type",
        "_id": "1",
        "_score": 1,
        "_source": {
          "id": "1",
          "teamId": 1,
          "memberTypes": [
            {
              "id": "3",
              "teamId": "1",
              "userId": "U77777777",
              "captain": true,
              "orderId": "O333333333",
              "createTime": "2019-07-09T05:17:15.285+0000",
              "updateTime": "2019-07-09T05:17:25.145+0000"
            },
            {
              "id": "2",
              "teamId": "1",
              "userId": "U88888888",
              "captain": false,
              "orderId": "O222222222",
              "createTime": "2019-07-09T05:16:45.362+0000",
              "updateTime": "2019-07-09T05:16:57.684+0000"
            },
            {
              "id": "1",
              "teamId": "1",
              "userId": "U99999999",
              "captain": false,
              "orderId": "O111111111",
              "createTime": "2019-07-09T05:16:21.608+0000",
              "updateTime": "2019-07-09T05:16:32.736+0000"
            }
          ],
          "skuCode": "9944545412121",
          "ownerId": "U55555555",
          "status": "success",
          "needAmount": 10,
          "createTime": "2019-07-09T05:18:27.576+0000",
          "updateTime": "2019-07-09T05:18:50.830+0000"
        }
      }
    ]
  }
}

查询结果出来是2个TeamType,现在需求是这样的:先对TeamType进行一个过滤,然后对其内部嵌套的MemberType再进行一个过滤。以上面的查询结果为例,我要查询"status"等于"success",然后内部的MemberType的"captain"属性为false。也就是说我期望的结果如下:

{
    "hits": {
        "total": 2,
        "max_score": 1,
        "hits": [
            {
                "_index": "team_index",
                "_type": "team_type",
                "_id": "2",
                "_score": 1,
                "_source": {
                    "id": "2",
                    "teamId": 2,
                    "memberTypes": [
                        {
                            "id": "5",
                            "teamId": "2",
                            "userId": "U22222222",
                            "captain": false,
                            "orderId": "O888888888",
                            "createTime": "2019-07-09T05:18:00.303+0000",
                            "updateTime": "2019-07-09T05:18:09.365+0000"
                        },
                        {
                            "id": "4",
                            "teamId": "2",
                            "userId": "U11111111",
                            "captain": false,
                            "orderId": "O999999999",
                            "createTime": "2019-07-09T05:17:34.585+0000",
                            "updateTime": "2019-07-09T05:17:46.820+0000"
                        }
                    ],
                    "skuCode": "8887545454514",
                    "ownerId": "U00000001",
                    "status": "success",
                    "needAmount": 6,
                    "createTime": "2019-07-09T05:18:56.112+0000",
                    "updateTime": "2019-07-09T05:19:16.234+0000"
                }
            },
            {
                "_index": "team_index",
                "_type": "team_type",
                "_id": "1",
                "_score": 1,
                "_source": {
                    "id": "1",
                    "teamId": 1,
                    "memberTypes": [
                        {
                            "id": "2",
                            "teamId": "1",
                            "userId": "U88888888",
                            "captain": false,
                            "orderId": "O222222222",
                            "createTime": "2019-07-09T05:16:45.362+0000",
                            "updateTime": "2019-07-09T05:16:57.684+0000"
                        },
                        {
                            "id": "1",
                            "teamId": "1",
                            "userId": "U99999999",
                            "captain": false,
                            "orderId": "O111111111",
                            "createTime": "2019-07-09T05:16:21.608+0000",
                            "updateTime": "2019-07-09T05:16:32.736+0000"
                        }
                    ],
                    "skuCode": "9944545412121",
                    "ownerId": "U55555555",
                    "status": "success",
                    "needAmount": 10,
                    "createTime": "2019-07-09T05:18:27.576+0000",
                    "updateTime": "2019-07-09T05:18:50.830+0000"
                }
            }
        ]
    }
}

按照原有想法,先过滤"status"为"success"的,然后内部去过滤"memberTypes.captain"为false。但是实际使用并不是这么回事,我使用嵌套查询尝试了一下,但是没有得到期望的结果,查询如下:

GET team_index/_search

{
  "query": {
    "bool": {
      "must": [
        {"match": {
          "status": "success"
        }},
        {
          "nested": {
            "path": "memberTypes",
            "query": {
              "match": {
                "memberTypes.captain": false
              }
            }
          }
        }
      ]
    }
  }
}

使用这个查询出来的结果和不使用嵌套查询结果是一样的,当然也可能是因为我数据量少的原因。但是嵌套查询条件确实没有生效,查询结果中依然有"captain"为true的数据。不知道是不是我的思路有问题,如果有了解ES的可以告知一下,网上找了很久也没有找到合适的方法。如果根据结果来推导,会不会是这么一个逻辑,嵌套查询查找"captain"为false的TeamType,也就是说只要TeamType中的memberTypes有一个满足"captain"为false,那么就会将这个TeamType返回,而返回的结果是不过滤内部的MemberType的。为此我又专门添加了一条TeamType数据,并将其内部的MemberType的"captain"全部设置成true,然后再次查询,发现查询的结果依然是全部数据,也就是说嵌套的"captain"为false条件没有生效,所以我的猜想是错的。
目前完全进入了死胡同,感觉这么简单的查询,自己却没有办法解决。最后对查询的结果在代码里面对其进行筛选,不过这个方法感觉有点low。 代码如下:

    public Map<String, Object> queryMembers(Integer teamId) {
        Map<String,Object> resultMap = new HashMap<>();

        NestedQueryBuilder nestedQueryBuilder =
                new NestedQueryBuilder("memberTypes",termQuery("memberTypes.captain",false),ScoreMode.None);

        BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery()
                .must(termQuery("teamId",teamId)).must(nestedQueryBuilder);

        SearchQuery searchQuery = new NativeSearchQueryBuilder()
                .withIndices("team_index")
                .withTypes("team_type")
                .withQuery(boolQueryBuilder)
                .build();

        List<TeamType> teamTypeList = new ArrayList<>();
        Iterable<TeamType> teamTypes = teamTypeRepository.search(searchQuery);
        Iterator<TeamType> iterator = teamTypes.iterator();
        while (iterator.hasNext()) {
            TeamType teamType = iterator.next();
            List<MemberType> memberTypeList = teamType.getMemberTypes();

            teamType.setMemberTypes(memberTypeList.stream().filter(m -> !m.isCaptain()).collect(Collectors.toList()));
            teamTypeList.add(teamType);
        }

        resultMap.put("result",teamTypeList);

        return resultMap;
    }

不知道是不是自己使用查询的姿势不正确,但是不管是在java代码还是在kibana里面操作,都无法得到自己想要的结果,最后只能在代码中多结果再次进行一次过滤。官方文档中的说明也不是很清楚,自己看着感觉疑问挺多的。自己网上找了一些嵌套查询的例子,但是都只给查询的DSL,并没有返回相应的结果。
自己也不知道怎么解决了,问了几个同事也都没有解决,如果哪位小伙伴对这个问题比较熟悉,希望指点一下,自己现在也不知道到底问题处在哪里了。


另外有好几个小伙伴问我自建梯子的问题,因为我现在用的GCP服务器在海外(以前在日本,现在我迁到印度了),所以如果自建梯子必须要有海外的服务器,网上有如何薅羊毛的教程,一般都是一年或者送一定金额,具体可以网上百度一下。比如AWS、GCP,但是AWS速度比较慢,GCP的话目前好像国内没法注册了。你也可以自己买一个小型机,一月好像5刀左右吧。我将搭梯子的教程放到github,我以前在简书发过一次AWS的,但是被官方给锁定了,所以就和这次的项目代码放我的github了,有需要的可以自取。公众号如果不能打开github链接,建议到简书查看链接。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容