天天看点

《深入理解大数据:大数据处理与编程实践》一一第1章 大数据处理技术简介

近年来,大数据技术在全世界迅猛发展,引起了全世界的广泛关注,掀起了一个全球性的发展浪潮。大数据技术发展的主要推动力来自并行计算硬件和软件技术的发展,以及近年来行业大数据处理需求的迅猛增长。其中,大数据处理技术最直接的推动因素,当数google公司发明的mapreduce大规模数据分布存储和并行计算技术,以及apache社区推出的开源hadoop mapreduce并行计算系统的普及使用。为此,本书将重点介绍目前成为大数据处理主流技术和平台hadoop mapreduce并行处理和编程技术。

本章将简要介绍大数据处理相关的基本概念、技术及发展状况。大数据处理的核心技术是分布存储和并行计算,因此,本章首先简要介绍并行计算的基本概念和技术;在此基础上,将简要介绍mapreduce的基本概念、功能和技术特点;最后本章将进一步简要介绍开源hadoop系统的基本功能特点和组成。