在分布式计算服务中,HBase基于HDFS完成数据存储和运算。Java API层基于HBase之上,用于访问HBase中的数据。HBase的体系架构如图6-6所示。
图6-6 HBase的系统架构
(1)Master。
Master主要负责表和Region的管理工作。(www.xing528.com)
Master分配Region给Region Server,协调Region Server之间的工作,监控每个Region Server的运行状态,并平衡Region Server之间的负载。
(2)RegionServer。
HBase有许多个Region Server,每个Region Server又包含多个Region。Region Server是HBase最核心的模块,负责维护Master分配给它的Region集合,并处理对这些Region的读写操作。Client直接与Region Server连接,并经过通信获取HBase中的数据。HBase釆用HDFS作为底层存储文件系统,Region Server需要向HDFS写入数据,并利用HDFS提供可靠稳定的数据存储。Region Server并不需要提供数据复制和维护数据副本的功能。
(3)Zookeeper。
HBase集群的Master是整个集群的管理者,它必须知道每个Region Server的状态。HBase就是使用Zookeeper来管理Region Server状态的。每个Region Server都向Zookeeper注册,由Zookeeper实时监控每个Region Server的状态,并通知给Master。这样,Master就可以通过Zookeeper随时感知各个Region Server的工作状态。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。