2018-1-22大数据作业,2018-1-22数据作业
2018-1-22大数据作业,2018-1-22数据作业
1.什么是大数据技术 ,及其特点答:无法用现有的软件工具提取、存储、共享、分析和处理的海量的 复杂的数据集合。
特点:体量大、价值、类型多、速度快。
2.数据仓库Datawarehouse 使用主题存放操作 OLTP与OLAP的区别
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制
OLTP即联机事务处理,就是我们经常说的关系数据库,增删查改就是我们经常应用的东西,这是数据库的基础;TPCC(Transaction Processing Performance Council)属于此类。
OLAP即联机分析处理,是数据仓库的核心部心,所谓数据仓库是对于大量已经由OLTP形成的数据的一种分析型的数据库,用于处理商业智能、决策支持等重要的决策信息;数据仓库是在数据库应用到一定程序之后而对历史数据的加工与分析,读取较多,更新较少,TPCH属于此类。
随着大数据时代的到来,对于OLAP,列存储模式或者说nosql模式比传统意义的行存储模式可能更具优势。
答:数据分析ELT(ExtractTransformLoader)只是在已定的假设,先验约束上处理原有计算方法,统计方法,将数据分析转化为信息,而这些信息需要进一步的获得认知,转化为有效的预测和决策,这时就需要数据挖掘(DataMine)。
hadoop是一个实现了MapReduce模式的能够对大量数据进行分布式处理的软件框架
版权声明:本文为博主原创文章,未经博主允许不得转载。 http://blog.csdn.net/Zxb0705/article/details/79132100
评论暂时关闭