书籍地址:https://item.jd.com/13311000.html
书籍包含资料:ppt+项目代码+数据集+安装包+配置文件(完整免费提供)

书籍配套视频:30G+配置视频+完整资料(购书免费赠送)
资料截图
视频截图(不加密,可以直接播放)
服务:购买书籍提供答疑服务
备注:购买书籍后,扫码可以免费获取以上所有资料!
书籍大纲:
第1章 大数据技术概述
1.1什么是大数据
1.2大数据平台架构
1.3大数据工程师的技能树
1.4大数据项目需求分析与设计
1.5本章小结
第2章 搭建IDEA开发环境及Linux虚拟机
2.1搭建IDEA开发环境
2.2搭建Linux虚拟机
2.3本章小结
第3章 基于Hadoop构建大数据平台
3.1Zookeeper分布式协调服务
3.2HDFS分布式文件系统
3.3YARN资源管理系统
3.4Hadoop分布式集群构建
3.5MapReduce分布式计算框架
3.6本章小结
第4章 基于HBase和Kafka构建海量数据存储与交换系统
4.1构建HBase分布式实时数据库
4.2搭建Kafka分布式消息系统
4.3本章小结
第5章 用户行为离线分析——构建日志采集和分析平台
5.1搭建Flume日志采集系统
5.2使用Flume采集用户行为数据
5.3基于Hive的离线大数据分析
5.4基于Hive 的用户行为数据离线分析
5.5本章小结
第6章 基于Spark的用户行为实时分析
6.1Spark 快速入门
6.2Spark Core的核心功能
6.3Spark分布式集群的搭建
6.4基于Spark Streaming的新闻项目实时分析
6.5基于Spark SQL的新闻项目离线分析
6.6基于Spark Structured Streaming的新闻项目实时分析
6.7本章小结
第7章 基于Flink的用户行为实时分析
7.1Flink快速入门
7.2Flink分布式集群搭建
7.3基于Flink DataStream的新闻项目实时分析
7.4基于Flink DataSet的新闻项目离线分析
7.5本章小结
第8章 用户行为数据可视化
8.1构建Java Web系统查询用户行为
8.2用户行为数据展示与分析
8.3本章小节