内存计算技术资料整理,计算技术资料整理


先来看一下一张技术的全景图,其中涉及内存计算的技术标成红色。


 

1)事务处理:主要分为Cache(Memcached, Redis, GemFire)RDBMSNewSQL(VoltDB为首的)三部分,缓存和NewSQL数据库是关注的重点。

2)流式处理:Storm本身只是计算的框架,而Spark-Streaming才实现了内存计算式的流处理。

3)分析阶段的对比:

Ø  通用处理:MapReduceSpark

Ø  查询:HivePigSpark-Shark

Ø  数据挖掘:MahoutSpark-MLLibSpark-GraphX

从上可以看出,Spark生态圈的子项目以及Impala都是值得关注的重点。

理论

直接在GoogleBing.com搜索"论文名 pdf"

Implementation Techniques for Main Memory Database Systems

Main Memory Database Systems: An Overview

The Revolution in Database Architecture – Jim Gary

A Study of Index Structures for Main Memory Database Management Systems

High-Performance Concurrency Control Mechanisms for Main-Memory Databases

A bridging model for parallel computation (BSP model)

SEDA: An Architecture for Scalable, Well-Conditioned Internet Services

实时处理与流处理

关系代数的并行计算

并发计算模型BSPSEDA

NSMParquet:存储结构的衍化

产品

GemFireVoltDB

分布式缓存GemFire架构介绍

NewSQL数据库VoltDB特性简介

Spark

Spark分布式计算和RDD模型研究

Spark发展现状与战线

分布式内存文件系统Tachyon

Impala(Dremel)

Google Dremel数据模型详解()

Google Dremel数据模型详解()

Impala中的代码生成技术

 

相关内容

    暂无相关文章