二十三：从库的SQL 线程（MTS协调线程）和sql_slave_skip_counter参数（笔记）

一、调用流程大概如下

handle_slave_sql
 ->是否开启了slave_preserve_commit_order和log_slave_updates参数，开启的话需要设置提交顺序管理器
   if (opt_slave_preserve_commit_order && rli->opt_slave_parallel_workers > 0 &&
       opt_bin_log && opt_log_slave_updates)
     commit_order_mngr= new Commit_order_manager(rli->opt_slave_parallel_workers); //order commit 管理器
 
   rli->set_commit_order_manager(commit_order_mngr);
 ->如果是MTS则需要启动worker线程
   if (slave_start_workers(rli, rli->opt_slave_parallel_workers, &mts_inited) != 0)//启动worker线程
  {
    mysql_cond_broadcast(&rli->start_cond);
    mysql_mutex_unlock(&rli->run_lock);
    rli->report(ERROR_LEVEL, ER_SLAVE_FATAL_ERROR, ER(ER_SLAVE_FATAL_ERROR),
                "Failed during slave workers initialization");
    goto err;
  ->检查rep table是否是事务类型的如果不是则报警告
     if (!rli->is_transactional()) //是否是 table或者是file类型是table类型则支持事物
    rli->report(WARNING_LEVEL, 0,
    "If a crash happens this configuration does not guarantee that the relay "
    "log info will be consistent");
  -> 初始化 relay log 的访问位置
      if (rli->init_relay_log_pos(rli->get_group_relay_log_name(),
                              rli->get_group_relay_log_pos(),
                              true/*need_data_lock=true*/, &errmsg,
                              1 /*look for a description_event*/)) //初始化 relay log 的访问位置
     这个位置比较关键也就是从哪里开始读取我们的relay log。如果出现错误将会导致读取的relay log错误。
     因此我们需要保证rep info的安全，如果设置了recover relay log 那么将会初始化为最新一个relay log的
     开始位置，因为所有的未执行的binlog event将会从新拉取，老的relay log 已经不重要了。后面再说。
     
  -> GTID event没有办法使用sql_slave_skip_counter 其具体含义参考：
    Log_event::do_shall_skip
  
    mysql> set global sql_slave_skip_counter=1;
    ERROR 1858 (HY000): sql_slave_skip_counter can not be set when the server is running with 
    @@GLOBAL.GTID_MODE = ON. Instead, for each transaction that you want to skip, generate an 
    empty transaction with the same GTID as the transaction
   
  进入循环 知道SQL线程被杀死
  
  -> 进入状态stage_reading_event_from_the_relay_log
  -> 进行一段skip event的判断和日志输出
  
    GTID event没有办法使用sql_slave_skip_counter 其具体含义参考：
    Log_event::do_shall_skip
  
    mysql> set global sql_slave_skip_counter=1;
    ERROR 1858 (HY000): sql_slave_skip_counter can not be set when the server is running with 
    @@GLOBAL.GTID_MODE = ON. Instead, for each transaction that you want to skip, generate an 
    empty transaction with the same GTID as the transaction  
    
  -> exec_relay_log_event 读取应用 一个event的上层接口
    ->next_event 读取下一个Event 完成MTS的检查点
      ->获取开始位置 rli->set_event_start_pos(my_b_tell(cur_log));
      ->Log_event::read_log_event
      
      ->如果是MTS 是否需要进行检查点
        1、是否超过检查点周期
           周期检查在函数mts_checkpoint_routine内部
           
             set_timespec_nsec(&curr_clock, 0);
             ulonglong diff= diff_timespec(&curr_clock, &rli->last_clock);
              if (!force && diff < period)
              {
                /*
                  We do not need to execute the checkpoint now because
                  the time elapsed is not enough.
                */
                DBUG_RETURN(FALSE);
              }
           
        2、是否已经GAQ已经满了 
          bool force= (rli->checkpoint_seqno > (rli->checkpoint_group - 1)); //如果达到了 GAQ的大小 设置为force 强制checkpoint 
           
      ->是否relay log 大小已经达到最大 是否需要relay log切换
        但是需要注意如果本事物没有结束不能进行切换
        
        ```
        /*                                                                                                                                          
                  If we have reached the limit of the relay space and we  如果我们达到 relay_log_space_limit 上限 需要通知IO THREAD进行切换 清理空间```
                  are going to sleep, waiting for more events:                                                                                      
                                                                                                                                                 
                  1. If outside a group, SQL thread asks the IO thread                                                                              
                     to force a rotation so that the SQL thread purges                                                                              
                     logs next time it processes an event (thus space is                                                                            
                     freed).                                                                                                                        
                                                                                                                                            
                  2. If in a group, SQL thread asks the IO thread to                                                                                
                     ignore the limit and queues yet one more event                                                                                 
                     so that the SQL thread finishes the group and                                                                                  
                     is are able to rotate and purge sometime soon.                                                                                 
                 */                                                                                                                                 
                if (rli->log_space_limit &&                                                                                                         
                    rli->log_space_limit < rli->log_space_total)                                                                                    
                {                                                                                                                                   
                  /* force rotation if not in an unfinished group */                                                                                
                  if (!rli->is_parallel_exec())                                                                                                     
                  {                                                                                                                                 
                    rli->sql_force_rotate_relay= !rli->is_in_group(); //如果不是一组就需要切换                                                      
                  }                                                                                                                                 
                  else                                                                                                                              
                  {                                                                                                                                 
                    rli->sql_force_rotate_relay=                                                                                                    
                      (rli->mts_group_status != Relay_log_info::MTS_IN_GROUP);                                                                      
                  }                                                                                                                                 
                  /* ask for one more event */                                                                                                      
                  rli->ignore_log_space_limit= true;//是一组 不能切换                                                                               
                }           
        ```                    
        ->如果读取了当前relay log的全部的relay log event，
         ->如果是当前relay log
           ->空闲状态下等待io 线程的唤醒，如果是MTS还需要定期醒来进行检查点，如下：
             ```  
             if (rli->is_parallel_exec() && (opt_mts_checkpoint_period != 0 ||
              DBUG_EVALUATE_IF("check_slave_debug_group", 1, 0)))
          {
            int ret= 0;
            struct timespec waittime;
            ulonglong period= static_cast<ulonglong>(opt_mts_checkpoint_period * 1000000ULL);
            ulong signal_cnt= rli->relay_log.signal_cnt;
         
            mysql_mutex_unlock(log_lock);
            do
            {
              /*
                At this point the coordinator has no job to delegate to workers.
                However, workers are executing their assigned jobs and as such
                the checkpoint routine must be periodically invoked.
              */
              (void) mts_checkpoint_routine(rli, period, false, true/*need_data_lock=true*/); // TODO: ALFRANIO ERROR
              mysql_mutex_lock(log_lock);
         
              if (DBUG_EVALUATE_IF("check_slave_debug_group", 1, 0))
                period= 10000000ULL;
         
              set_timespec_nsec(&waittime, period);
              ret= rli->relay_log.wait_for_update_relay_log(thd, &waittime);
            } while ((ret == ETIMEDOUT || ret == ETIME) /* todo:remove */ &&
                     signal_cnt == rli->relay_log.signal_cnt && !thd->killed);
          }
          else
          {
            rli->relay_log.wait_for_update_relay_log(thd, NULL); //等待relay log 更改的信号 SQL THREAD 会等待在这里
          }        
             ```     
         -> 如果不是当前relay log 那么 SQL线程应用或者分发完成完成后就可以清理了
            并且参数relay_log_purge需要设置为1     
            
            if (rli->relay_log.purge_first_log
            (rli,
             rli->get_group_relay_log_pos() == rli->get_event_relay_log_pos()
             && !strcmp(rli->get_group_relay_log_name(),rli->get_event_relay_log_name())))//做relay log的清理
            
    -> 如果是单SQL现成 获取event的时间
       这一步 就是获取计算延迟的重要因素,但是注意MTS不是在这里实在检查点里面
       last_master_timestamp
       ```
       rli->last_master_timestamp= ev->common_header->when.tv_sec + //event header 的timestamp
                                  (time_t) ev->exec_time; //获取event的 timestamp作为 计算last_master_timestamp的基础数据 query event才有的执行时间
       DBUG_ASSERT(rli->last_master_timestamp >= 0);       //但是对于MTS来讲应该注意是最后一个XID EVENT的 时间不是这里设置的 在mts_checkpoint_routine里面
       ```
       
    -> 如果GITD_MODE 且AUTO_POSITION 且是MTS需要由协调线程进行半事物的恢复 (partial transaction)    
       构造回滚EVENT进行恢复，而对已非MTS会在gtid event做回滚。
       这种情况可能出现在：
       - AUTO_POSITION情况下如果重连，会重新发送已经传输的Event。
       - AUTO_POSITION情况下如果从库异常宕机重启，并且recovery_relay_log=0的情况下,会重新发送已经传输的Event,并且relay log pos不会重置
       
       因此我们前面在IO线程和DUMP线程中已经讨论了，每次sql线程的启动都会通过GTID去重新寻找需要拉取的
       位置。
       
       coord_handle_partial_binlogged_transaction(rli, ev) 
       
    -> apply_event_and_update_pos 非MTS 完成 应用 MTS完成分发
      -> 进行skip event操作
         
      -> 维护skip counter计数器
           if (reason == Log_event::EVENT_SKIP_COUNT)
              {
                --rli->slave_skip_counter;//维护skip count
                skip_event= TRUE;
              }
         我们看到slave_skip_counter是以event为单位的，但是对于最后一个event如果跨事务了
         那么整个事物都需要跳过。但是skip在GTID模式下是不能用的。       
      -> 如果不能跳过的事务 就需要应用了。MTS则完成分发
         ->完成延迟应用逻辑
           sql_delay_event(ev, thd, rli)
           
         ->ev->apply_event(rli); 这里单SQL线程应用 MTS完成分发，分发方式参考前面
           ->是否是进行 MTS recovery if (rli->is_mts_recovery())
              根据 bitmap 设置进行跳过处理 
             
               if (rli->is_mts_recovery())//如果是恢复 这个地方就是前面恢复扫描出来的位置
               {
                 bool skip=
                   bitmap_is_set(&rli->recovery_groups, rli->mts_recovery_index) &&
                   (get_mts_execution_mode(::server_id,
                                           rli->mts_group_status ==
                                           Relay_log_info::MTS_IN_GROUP,
                                           rli->current_mts_submode->get_type() ==
                                           MTS_PARALLEL_TYPE_DB_NAME)
                    == EVENT_EXEC_PARALLEL);
                 if (skip)
                 {
                   DBUG_RETURN(0);
                 }
                 else
                 {
                   DBUG_RETURN(do_apply_event(rli));
                 }
               }

最后编辑于：2019.07.09 11:19:14

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,294评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,493评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,790评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,595评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,718评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,906评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,053评论 3赞 410
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,797评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,250评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,570评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,711评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,388评论 4赞 332
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,018评论 3赞 316
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,796评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,023评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,461评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,595评论 2赞 350

二十三：从库的SQL 线程（MTS协调线程）和sql_slave_skip_counter参数（笔记）

一、调用流程大概如下

推荐阅读更多精彩内容