Elasticsearch源码分析-搜索分析(二)

0. 前言

在上一篇文章中主要讲述了elasticsearch搜索过程的第一部分，主要逻辑包括：
1.接收search请求，然后对请求进行转发
2.匹配相应的action，对请求参数进行解析
3.根据search_type获取对应的TransportSearchTypeAction，执行具体的搜索逻辑

本文将接着上篇文章，以QUERY_THEN_FETCH为例，讲解搜索的QUERY阶段具体逻辑

1. 搜索参数初始化

由上篇文章可知，如果search_type为空（默认）或者为"query_then_fetch"，那么elasticsearch会调用TransportSearchTypeAction的子类TransportSearchQueryThenFetch的execute()方法，以获取搜索结果，类图如下：

TransportSearchQueryThenFetchClass.png

从类图中可以看出，方法的执行顺序为：

TransportSearchQueryThenFetchSeg.png

因此elasticsearch的搜索过程，就是调用TransportSearchQueryThenFetchAction的doExecute()方法，具体就是构造AsyncAction对象，然后执行其start()方法

public class TransportSearchQueryThenFetchAction extends TransportSearchTypeAction {
    @Override
    protected void doExecute(SearchRequest searchRequest, ActionListener<SearchResponse> listener) {
        new AsyncAction(searchRequest, listener).start();
    }
    
    private class AsyncAction extends BaseAsyncAction<QuerySearchResultProvider> {
        final AtomicArray<FetchSearchResult> fetchResults;
        final AtomicArray<IntArrayList> docIdsToLoad;
        private AsyncAction(SearchRequest request, ActionListener<SearchResponse> listener) {
            super(request, listener);
            fetchResults = new AtomicArray<>(firstResults.length());
            docIdsToLoad = new AtomicArray<>(firstResults.length());
        }
    }
}

AsyncAction和BaseAsyncAction以及TransportSearchQueryThenFetchAction类图如下：

TransportSearchQueryThenFetchClass_1.png

从上图和代码我们可以看到，执行AsyncAction的start()方法其实是执行BaseAsyncAction的start()方法，在构造AsyncAction时
（1）调用父类BaseAsyncAction的构造方法
（2）初始化两个数组，即fetchResults和docIdsToLoad
fetchResults: 用来存储Fetch完成后shardIndex和对应的FetchResult
docIdsToLoad: 用来存储Query完成后shardIndex和待Fetch的文档id集合DocId

BaseAsyncAction的构造方法代码如下：

protected abstract class BaseAsyncAction<FirstResult extends SearchPhaseResult> extends AbstractAsyncAction {
    protected BaseAsyncAction(SearchRequest request, ActionListener<SearchResponse> listener) {
            ...
            String[] concreteIndices = clusterState.metaData().concreteIndices(request.indicesOptions(), request.indices());
            Map<String, Set<String>> routingMap = clusterState.metaData().resolveSearchRouting(request.routing(), request.indices());
            shardsIts = clusterService.operationRouting().searchShards(clusterState, request.indices(), concreteIndices, routingMap, request.preference());
            expectedSuccessfulOps = shardsIts.size();
            expectedTotalOps = shardsIts.totalSizeWith1ForEmpty();
            firstResults = new AtomicArray<>(shardsIts.size());
            ...
    }
}

在父类BaseAsyncAction的构造方法中，主要初始化了如下数据:
clusterState: 集群状态信息
nodes: 集群节点信息
concreteIndices: request中的索引转化成实际要搜索的索引
shardsIts: 需要搜索的index的shard，包括一些shard偏好
expectedSuccessfulOps: 所需执行的shard总数
expectedTotalOps: 期望多少个shard给出响应
firstResults: 用来存储每个shard的Query结果集

搜索请求使用preference参数支持搜索偏好，具体代码如下：

private ShardIterator preferenceActiveShardIterator(IndexShardRoutingTable indexShard, String localNodeId, DiscoveryNodes nodes, @Nullable String preference) {
    preferenceType = Preference.parse(preference);
    switch (preferenceType) {
        case PREFER_NODE:
            return indexShard.preferNodeActiveInitializingShardsIt(preference.substring(Preference.PREFER_NODE.type().length() + 1));
        case LOCAL:
            return indexShard.preferNodeActiveInitializingShardsIt(localNodeId);
        case PRIMARY:
            return indexShard.primaryActiveInitializingShardIt();
        case PRIMARY_FIRST:
            return indexShard.primaryFirstActiveInitializingShardsIt();
        case ONLY_LOCAL:
            return indexShard.onlyNodeActiveInitializingShardsIt(localNodeId);
        case ONLY_NODE:
            String nodeId = preference.substring(Preference.ONLY_NODE.type().length() + 1);
            ensureNodeIdExists(nodes, nodeId);
            return indexShard.onlyNodeActiveInitializingShardsIt(nodeId);
        default:
            throw new ElasticsearchIllegalArgumentException("unknown preference [" + preferenceType + "]");
    }
}

preference类型具体的含义如下：
_prefer_node: 优选使用提供的节点标识
_local: 查询将优先在本地分配的分片上执行
_primary: 查询将在主分片上执行, 如果不可用,将在其他分片上执行
_primary_first: 该查询将仅在主分片上执行
_only_local: 查询将仅在本地分配的分片上执行
_only_node: 将查询限制为仅在具有提供的节点标识的节点上执行

在调用AsyncAction的构造方法完成参数初始化之后，就会调用BaseAsyncAction的start()开始搜索

2. 搜索QUERY整体流程

start()的逻辑主要是遍历每一个要搜索的shard，对每个shard都去调用performFirstPhase()方法获取搜索结果

protected abstract class BaseAsyncAction<FirstResult extends SearchPhaseResult> extends AbstractAsyncAction {
    public void start() {
        ...
        int shardIndex = -1;
        for (final ShardIterator shardIt : shardsIts) {
            shardIndex++;
            final ShardRouting shard = shardIt.nextOrNull();
            if (shard != null) {
                performFirstPhase(shardIndex, shardIt, shard);
            }
            ...
        }
    }

在performFirstPhase()中主要是获取要搜索shard所在的节点，然后在指定的节点上执行搜索，拿到搜索结果后调用onFirstPhaseResult()方法获取待fetch的doc id集合，然后判断是否可以进入第二阶段执行Fetch

protected abstract class BaseAsyncAction<FirstResult extends SearchPhaseResult> extends AbstractAsyncAction {
    void performFirstPhase(final int shardIndex, final ShardIterator shardIt, final ShardRouting shard) {
        if (shard == null) {
            ...
        } else {
            final DiscoveryNode node = nodes.get(shard.currentNodeId());
            if (node == null) {
                ...
            } else {
                String[] filteringAliases = clusterState.metaData().filteringAliases(shard.index(), request.indices());
                sendExecuteFirstPhase(node, internalSearchRequest(shard, shardsIts.size(), request, filteringAliases, startTime(), useSlowScroll), new SearchServiceListener<FirstResult>() {
                    @Override
                    public void onResult(FirstResult result) {
                        onFirstPhaseResult(shardIndex, shard, result, shardIt);
                    }

                    @Override
                    public void onFailure(Throwable t) {
                        onFirstPhaseResult(shardIndex, shard, node.id(), shardIt, t);
                    }
                });
            }
        }
    }

在onFirstPhaseResult()中主要是通过processFirstPhaseResult()方法，将第一阶段的Query结果放入firstResults对象中，然后判断已经获得结果的shard数是否和期望得到响应的shard数一致，如果一致，则进入第二阶段执行Fetch获取文档详情

protected abstract class BaseAsyncAction<FirstResult extends SearchPhaseResult> extends AbstractAsyncAction {
    void onFirstPhaseResult(int shardIndex, ShardRouting shard, FirstResult result, ShardIterator shardIt) {
        result.shardTarget(new SearchShardTarget(shard.currentNodeId(), shard.index(), shard.id()));
        processFirstPhaseResult(shardIndex, shard, result);
        successfulOps.incrementAndGet();
        final int xTotalOps = totalOps.addAndGet(shardIt.remaining() + 1);
        if (xTotalOps == expectedTotalOps) {
            try {
                innerMoveToSecondPhase();
            } catch (Throwable e) {
                if (logger.isDebugEnabled()) {
                    logger.debug(shardIt.shardId() + ": Failed to execute [" + request + "] while moving to second phase", e);
                }
                raiseEarlyFailure(new ReduceSearchPhaseException(firstPhaseName(), "", e, buildShardFailures()));
            }
        } 
        ...
    }
}

3.在shard上进行搜索

通过上一部分，我们得知elasticsearch会获取要搜索的shard所在的节点，然后通过sendExecuteFirstPhase()方法将search request发送到该节点执行Query，以获取相应的search结果，且sendExecuteFirstPhase会被不同的search_type重写。

1.QUERY_THEN_FETCH的sendExecuteFirstPhase会继续调用SearchServiceTransportAction.sendExecuteQuery继续发送search request。

private class AsyncAction extends BaseAsyncAction<QuerySearchResultProvider> {
    @Override
    protected void sendExecuteFirstPhase(DiscoveryNode node, ShardSearchTransportRequest request, SearchServiceListener<QuerySearchResultProvider> listener) {
        searchService.sendExecuteQuery(node, request, listener);
    }
}

2.在SearchServiceTransportAction的sendExecuteQuery()方法中，会首先判断要请求的节点是否是当前节点：
2.1 如果是当前节点，则直接执行execute()方法。在execute()方法中，线程池首先会执行入参传的callable的call()方法，根据执行的结果，如果为null则执行listener的onFailure()方法，否则执行onResult()方法
在callable的call()方法中，直接执行SearchService的executeQueryPhase()方法。

public class SearchServiceTransportAction extends AbstractComponent {
    public void sendExecuteQuery(DiscoveryNode node, final ShardSearchTransportRequest request, final SearchServiceListener<QuerySearchResultProvider> listener) {
        if (clusterService.state().nodes().localNodeId().equals(node.id())) {
            execute(new Callable<QuerySearchResultProvider>() {
                @Override
                public QuerySearchResultProvider call() throws Exception {
                    return searchService.executeQueryPhase(request);
                }
            }, listener);
        } else {
            ...
        }
    }

    private <T> void execute(final Callable<? extends T> callable, final SearchServiceListener<T> listener) {
        try {
            threadPool.executor(ThreadPool.Names.SEARCH).execute(new Runnable() {
                @Override
                public void run() {
                    T result = null;
                    Throwable error = null;
                    try {
                        result = callable.call();
                    } catch (Throwable t) {
                        error = t;
                    } finally {
                        if (result == null) {
                            assert error != null;
                            listener.onFailure(error);
                        } else {
                            assert error == null : error;
                            listener.onResult(result);
                        }
                    }
                }
            });
        } catch (Throwable t) {
            listener.onFailure(t);
        }
    }
}

2.2 如果要search的不是当前node，则需要将request发送到指定的node上，该方法带了两个比较重要的入参QUERY_ACTION_NAME和BaseTransportResponseHandler对象

transportService.sendRequest(node, QUERY_ACTION_NAME, request, new BaseTransportResponseHandler<QuerySearchResultProvider>() {
        @Override
        public QuerySearchResult newInstance() {
            return new QuerySearchResult();
        }
        @Override
        public void handleResponse(QuerySearchResultProvider response) {
            listener.onResult(response);
        }
        @Override
        public void handleException(TransportException exp) {
            listener.onFailure(exp);
        }
        @Override
        public String executor() {
            return ThreadPool.Names.SAME;
        }
    });

在elasticsearch启动时，会注入SearchServiceTransportAction，会将QUERY_ACTION_NAME注册到SearchQueryTransportHandler上

public class SearchServiceTransportAction extends AbstractComponent {
    @Inject
    public SearchServiceTransportAction(Settings settings, ThreadPool threadPool, TransportService transportService, ClusterService clusterService, SearchService searchService) {
        super(settings);
        transportService.registerHandler(QUERY_ACTION_NAME, new SearchQueryTransportHandler());
        ...
    }
}

在SearchQueryTransportHandler接收到消息之后，也会执行SearchService的executeQueryPhase()方法获取search结果，这种方式实现了本地和远程搜索

private class SearchQueryTransportHandler extends BaseTransportRequestHandler<ShardSearchTransportRequest> {
    @Override
    public ShardSearchTransportRequest newInstance() {
        return new ShardSearchTransportRequest();
    }
    @Override
    public void messageReceived(ShardSearchTransportRequest request, TransportChannel channel) throws Exception {
        QuerySearchResultProvider result = searchService.executeQueryPhase(request);
        channel.sendResponse(result);
    }

    @Override
    public String executor() {
        return ThreadPool.Names.SEARCH;
    }
}

4.搜索Query逻辑

在SearchService的executeQueryPhase()中，主要步骤是：
（1）创建search context
（2）预处理query
（3）加载缓存或者查询lucene
（4）如果search_type是count，则释放search context
（5）记录慢query日志

public class SearchService extends AbstractLifecycleComponent<SearchService> {
    public QuerySearchResultProvider executeQueryPhase(ShardSearchRequest request) throws ElasticsearchException {
        final SearchContext context = createAndPutContext(request);
        try {
            context.indexShard().searchService().onPreQueryPhase(context);
            long time = System.nanoTime();
            contextProcessing(context);
            loadOrExecuteQueryPhase(request, context, queryPhase);
            if (context.searchType() == SearchType.COUNT) {
                freeContext(context.id());
            } else {
                contextProcessedSuccessfully(context);
            }
            context.indexShard().searchService().onQueryPhase(context, System.nanoTime() - time);

            return context.queryResult();
        } catch (Throwable e) {
            ...
        } finally {
            cleanContext(context);
        }
    }
}

在调用createAndPutContext创建context时，主要操作如下：
（1）根据index shard获取对应的lucene searcher，即lucene的搜索对象
（2）设置scroll，解析source，设置from和size
（3） query预处理，将elasticsearch的query转化为lucene的query
（4） search context默认保存5分钟

在创建完context后，开始调用loadOrExecuteQueryPhase执行查询，如果search_type是COUNT且满足cache的条件，则从cache获取结果，否则调用QueryPhase的execute()方法执行lucene搜索

public class QueryPhase implements SearchPhase {
    public void execute(SearchContext searchContext) throws QueryPhaseExecutionException {
        boolean rescore = false;
        try {
            searchContext.queryResult().from(searchContext.from());
            searchContext.queryResult().size(searchContext.size());

            Query query = searchContext.query();
            TopDocs topDocs;
            int numDocs = searchContext.from() + searchContext.size();
            if (searchContext.searchType() == SearchType.COUNT || numDocs == 0) {
                TotalHitCountCollector collector = new TotalHitCountCollector();
                searchContext.searcher().search(query, collector);
                topDocs = new TopDocs(collector.getTotalHits(),
                Lucene.EMPTY_SCORE_DOCS, 0);
            } else if (searchContext.searchType() == SearchType.SCAN) {
                topDocs = searchContext.scanContext().execute(searchContext);
            } else {
                if (!searchContext.useSlowScroll() && searchContext.request().scroll() != null) {
                    
                } else {
                    if (searchContext.sort() != null) {
                        topDocs = searchContext.searcher().search(
                                    query, 
                                    null,
                                    numDocs, searchContext.sort(),
                                    searchContext.trackScores(),
                                    searchContext.trackScores());
                    } else {
                        topDocs = searchContext.searcher().search(query, numDocs);
                    }
                }
            }
            searchContext.queryResult().topDocs(topDocs);
        } catch (Throwable e) {
            throw new QueryPhaseExecutionException(searchContext, "Failed to execute main query", e);
        } finally {
                                    searchContext.searcher().finishStage(ContextIndexSearcher.Stage.MAIN_QUERY);
        }
        if (rescore) { // only if we do a regular search
            rescorePhase.execute(searchContext);
        }
        suggestPhase.execute(searchContext);
        facetPhase.execute(searchContext);
        aggregationPhase.execute(searchContext);
    }
}

lucene search完成后将top docs放入search context中，至此已经完成了一个shard的搜索。如果已经搜索shard数和期望要执行的shard数相等，那么执行innerMoveToSecondPhase()方法进入第二阶段执行Fetch，具体逻辑将会在第三篇文章中介绍。

最后编辑于：2018.12.13 11:11:14

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,123评论 6赞 490
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,031评论 2赞 384
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,723评论 0赞 345
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,357评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,412评论 5赞 384
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,760评论 1赞 289
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,904评论 3赞 405
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,672评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,118评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,456评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,599评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,264评论 4赞 328
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,857评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,731评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,956评论 1赞 264
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,286评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,465评论 2赞 348