HBase总结
()
- 基���介绍
- 特点(高可靠、高性能、面向列、可伸缩)
- 非关系型数据库
- 大数据实时处理
- 表规模达数十亿行及数百万列
- 读、写访问可实时
- 分布式存储系统
- HDFS(Hadoop Distributed File System)文件存储
- ZooKeeper作为协同服务
- 列存储
- 优点:有利于单列数据查询
- 缺点:整行读取时效率较慢,需要多次IO操作
- 与RDB(关系型数据库区别)
- 索引
- 多个索引(联合索引)
- 行键(HBase)
- 数据维护
- 当前值替换原值
- 新增-版本号(HBase)
- 可伸缩性
- 集群、分片、分库分表
- 增加HRigionServer节点(HBase)
- 索引
- 使用场景
- 场景分析
- 海量数据(TB、PB)
- 不需要事务特性处理(ACID)
- 高吞吐量
- 在海量数据中实现随机读取
- 需要很好伸缩能力
- 需要同时处理结构化和非结构化的数据
- 场景分析
- 特点(高可靠、高性能、面向列、可伸缩)
The End