天天看點

《深入了解大資料:大資料處理與程式設計實踐》一一第1章 大資料處理技術簡介

近年來,大資料技術在全世界迅猛發展,引起了全世界的廣泛關注,掀起了一個全球性的發展浪潮。大資料技術發展的主要推動力來自并行計算硬體和軟體技術的發展,以及近年來行業大資料處理需求的迅猛增長。其中,大資料處理技術最直接的推動因素,當數google公司發明的mapreduce大規模資料分布存儲和并行計算技術,以及apache社群推出的開源hadoop mapreduce并行計算系統的普及使用。為此,本書将重點介紹目前成為大資料處理主流技術和平台hadoop mapreduce并行處理和程式設計技術。

本章将簡要介紹大資料處理相關的基本概念、技術及發展狀況。大資料處理的核心技術是分布存儲和并行計算,是以,本章首先簡要介紹并行計算的基本概念和技術;在此基礎上,将簡要介紹mapreduce的基本概念、功能和技術特點;最後本章将進一步簡要介紹開源hadoop系統的基本功能特點群組成。