初识Hadoop—邻家有女初长成



HBase:是ApacheHadoop项目的一个重要部分,是一个开源的、基于列存储模型的分布式数据库

Hive:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

Pig:是在MapReduce上构建的一种高级的数据流语言,是Sawzall的开源实现。sawzan是一种建立在MaPReduce基础上的领域语言,它的程序控制结构(如if、while等)与C语言无异,但它的领域语言语义使它完成相同功能的代码比MaPReduc。的C++代码简洁得多。

相关内容