HBase 基础总结
1. 概述
分布式、可扩展、支持海量数据存储的 NoSQL 数据库
2. HBase 架构
- Master :维护表结构信息,比如建表、删表、移动 Region、合并等
- 监控 RegionServer
- 处理 RegionServer 故障转移
- 处理元数据的变更
- 分配 regions 到每个 RegionServer
- RegionServer :负责存储数据的服务器,存放 Region 的容器
- 负责存储 HBase 的实际数据
- 处理分配给它的 Region
- 刷新缓存到 HDFS
- 维护 Hlog
- 执行压缩
- 负责处理 Region 分片
- Region : 一段数据的集合,HBase 的一个表有多个 Region
- 不能跨服务器
- 数据量大的时候,HBase 会拆分 Region
依赖 Zookeper 的服务
3. HBase 存储的概念
- Cell : 单元格
- 列 :最基本的存储单位
- 列族 :列必须依赖列族存在,指定一个列【 列族 : 列 】
- 行 :每行数据由一个 row key 和多个列组成,数据是按照 RowKey 的字典顺序存储的
唯一确定一条结果的表示 ——【 行键:列族:列:版本号 】
- 时间戳 :用来标识数据的不同版本
- 本文作者: Kelly Liu
- 本文链接: http://tiantianliu2018.github.io/2020/04/24/HBase-基础总结/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!