大数据的概念
1.海量:数据量一定要大
2.高增长率:一定的时间内数据快速增长
3.多样化:数据的种类千奇百怪
1.海量数据的储存
2.海量数据的分析计算
bit、byte、kb、mb、gb、tb、pb、eb、zb、yb、bb、nb、db
hadoop
hadoop主要版本
最原始(最基础)的版本,对于入门学习最好
内部集成很多大数据框架,对应产品cdh
ps:hortonworks已经被cloudera公司收购推出新品牌cdp
hadoop版本号的区别
hdfs框架的组成
yarn架构组成
mapreduce架构组成
技术生态圈