浅析HBase架构和系统结构介绍(六)


6 HBase 上的MapReduce

在HBase系统上运行批处理运算,最方便和实用的模型依然是MapReduce,如下图:


HBase table和region的关系,比较类似HDFSfile和block的关系,HBase提供了配套的TableInputFormat和TableOutputFormat API,可以方便的将HBase table作为Hadoop MapReduce的source和sink,对于MapReduce job应用开发人员来说,基本不需要关注HBase系统自身的细节。

相关内容