如何优化HBase行键设计以提升架构师应用效率?

2026-05-05 17:400阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计764个文字,预计阅读时间需要4分钟。

如何优化HBase行键设计以提升架构师应用效率?

首先回答一个问题,为什么要使用HBase?随着业务不断发展、数据量不断增大,MySQL数据库存在以下问题:MySQL支持的数据量仅为TB级,不能直接保留历史数据。而HBase支持的数据量可达PB级。

首先要回答一个问题,为何要使用HBase?
随着业务不断发展、数据量不断增大,MySQL数据库存在这些问题:

  • MySQL支持的数据量为TB级,不能一直保留历史数据。而HBase支持的数据量为PB级,适合存储久远的历史冷数据
  • 新增列的代价较高,数据量越大耗费时间越长。而HBase可以随意增加列,空列不占据空间,业务模型可以灵活变化

要使用HBase,最重要的一点是rowkey行键设计,如果设计不妥,后续要改的代价非常大。

HBase行键设计原则

下面列几个HBase rowkey设计的原则:

  • 组合键:组合键是指拼接多个业务字段,如需查询,则业务字段必须作为rowKey的一部分
  • 字段顺序:一对多,则一应该放在前面,以便能够scan得到结果,如用户id:订单id,如果反过来则无法得到用户下的所有订单
  • 业务字段对齐长度:因为rowKey是按字典序排列的,所以需要对齐长度,比如id取12位,9位id前补齐3个0,否则就会出现123456789比654321比排在前面的问题。
阅读全文

本文共计764个文字,预计阅读时间需要4分钟。

如何优化HBase行键设计以提升架构师应用效率?

首先回答一个问题,为什么要使用HBase?随着业务不断发展、数据量不断增大,MySQL数据库存在以下问题:MySQL支持的数据量仅为TB级,不能直接保留历史数据。而HBase支持的数据量可达PB级。

首先要回答一个问题,为何要使用HBase?
随着业务不断发展、数据量不断增大,MySQL数据库存在这些问题:

  • MySQL支持的数据量为TB级,不能一直保留历史数据。而HBase支持的数据量为PB级,适合存储久远的历史冷数据
  • 新增列的代价较高,数据量越大耗费时间越长。而HBase可以随意增加列,空列不占据空间,业务模型可以灵活变化

要使用HBase,最重要的一点是rowkey行键设计,如果设计不妥,后续要改的代价非常大。

HBase行键设计原则

下面列几个HBase rowkey设计的原则:

  • 组合键:组合键是指拼接多个业务字段,如需查询,则业务字段必须作为rowKey的一部分
  • 字段顺序:一对多,则一应该放在前面,以便能够scan得到结果,如用户id:订单id,如果反过来则无法得到用户下的所有订单
  • 业务字段对齐长度:因为rowKey是按字典序排列的,所以需要对齐长度,比如id取12位,9位id前补齐3个0,否则就会出现123456789比654321比排在前面的问题。
阅读全文