hbase读写请求流程详解

要理解读写流程,先要清除hbase的架构图。以0.96版本以下的三层架构为例:

Hbase的架构

hbase是主从架构,主节点是HMaster,从节点是HRegionServer。

HMaster:负责regionserver的运行状态和region负载均衡。

HRegionServer:负责存储表格,以及响应client的连接。包含一个HLog和多个HRegion。

zk负责保证HMaster的高可用和region server的注册。

-----------------------------------------------------------------------------------------------------------------------------------------------

1、hbase的读请求流程

hbase读请求

Ⅰ从zk中获取regionserver的meta信息。

Ⅱ通过root表,根据meta信息找到对应的regioonserver位置信息

Ⅲ找到对应的regionserver,获取table的meta信息

Ⅳ通过table的meta信息,找到实际存储table的regionserver

Ⅴ客户端直接连接表所在的regionserver,获取数据

--注:为了让客户端找到包含特定主键的region,HBase提供了两张特殊的目录表,包含.root和.meta。root表用来查询所有meta表中的region位置。hbase的设计中只有一个root region,即root region从不进行拆分。从而保证类似于B+树的三层查找结构。第一层是ZK中包含root region的节点,第二层是从root中查找对应meta region的位置,第三层是从meta表中查找用户表对应的region的位置信息。

2、hbase的写请求过程?

hbase写请求过程

1、client先从缓存中定位region,如果没有缓存则访问zk,找到最先写入的region信息。

2、将更新写到WAL中。为了防止发生数据丢失。

3、将数据写入到memstore中

4、数据达到阈值(默认128m)会触发flush操作,生成多个storefile文件。

5、当storefile文件过多,会触发compact操作,合并文件,生成Hfile。

6、当HFile文件大于阈值(默认10g),会触发split操作,新拆分的两个region会被master分发到对应的两个regionserver上。

-----------------------------------------------------------------------------------------------------------------------------------------------

注:0.96以上版本采用双层架构,删除了root表,只使用meta定位数据。meta表的一个region以12m来计算,可以定位16T的行键范围。如果1个行键范围包含10条数据,则有160T的数据,所以不需要root表。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、HBase简介 Hbase是什么 HBase是一种构建在HDFS之上的分布式、面向列、多版本、非关系型的数据库...
    便利蜂数据平台阅读 987评论 0 4
  • 一、简介 Hbase:全名Hadoop DataBase,是一种开源的,可伸缩的,严格一致性(并非最终一致性)的分...
    菜鸟小玄阅读 2,426评论 0 12
  • 简介 HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,...
    编码前线阅读 282评论 0 0
  • 1、基本概念 HBase是一个开源的非关系型分布式数据库(NoSQL),参考了谷歌的BIgTable建模,实现的编...
    雪飘千里阅读 1,037评论 0 2
  • 重读《豪婚》有感 文/林梦竹 0904 098 今天上午重读《豪婚》,下午上班继续每天一日的磨课。每个老师上台讲...
    竹海叶轩阅读 155评论 0 1