天天看点

Spark:统一分布式大数据分析引擎LearningSpark

今年早些时候Spark3.0发布,前几天看到Spark学习手册也发布了第二版涵盖Spark3.0功能,想起刚开始学习Spark时就是读的这本书,最近有空就直播读下Spark学习手册第2版这本书,若能帮助到一些人也是好的!

从2020年8月3号每天早上5:30读LearningSpark这本书,如果你想学习大数据学习Spark想早起就可以一起来直播间,如果你错过了直播也可以看视频回放!

Spark学习手册第二版 LearningSpark2.0 2020080301

LearningSpark之Spark缘起 2020080302

LearningSpark之Google名字的来历 2020080303

LearningSpark之大数据在Yahoo 2020080304

LearningSpark之Spark光芒初露 2020080401

LearningSpark之脱离了大数据的人工智能就是耍流氓 2020080402

LearningSpark之Spark的Speed 2020080403

LearningSpark之Spark的易用模块化易扩展 2020080404

LearningSpark之一统大数据分析 2020080501

LearningSpark之SparkSQL 2020080502

LearningSpark之StructuredStreaming 2020080503

LearningSpark之MLlib 2020080504

LearningSpark之GraphX 2020080505

LearningSpark之服务组件架构 2020080601

LearningSpark之Driver 2020080602

LearningSpark之部署模式yarn client和cluster的区别 2020080603

LearningSpark之分布式数据分片 2020080604

LearningSpark之开发者体验 2020080701

LearningSpark之数据科学家 2020080702

LearningSpark之数据工程师 2020080703

LearningSpark之使用场景和社区发展 2020080704

LearningSpark之下载安装 2020080801

LearningSpark之安装包目录结构 20200802

LearningSpark之使用Scala和PySpark Shell 20200803

LearningSpark之使用本地模式运行 20200804

LearningSpark之需要了解的名词 2020080901

LearningSpark之SparkApplication和SparkSession是什么?2020080902

LearningSpark之什么是转换动作和延迟执行? 2020080903

LearningSpark之什么是宽窄依赖? 2020080904

更新中