天天看點

書籍:掌握Python的網絡和安全 PySpark SQL Recipes_ With HiveQL, Dataframe and Graphframes - 2019.pdf

簡介

PySpark SQL Recipes:使用HiveQL,Dataframe和Graphframes Pdf

使用問題解決方案方法,使用PySpark SQL,圖形架構和圖形資料處理進行資料分析。本書提供了與資料架構,資料操作摘要和探索性分析相關的問題的解決方案。您将使用圖形架構提高圖形資料分析的技能,并了解如何優化PySpark SQL代碼。

PySpark SQL Recipes首先介紹了使用PySpark SQL建立來自不同類型資料源,資料聚合和彙總以及探索性資料分析的資料幀的方法。您還将了解如何使用圖框來解決圖分析中的問題。

完成本書後,您将擁有所有PySpark SQL任務的現成代碼,包括使用來自不同檔案格式以及SQL或NoSQL資料庫的資料建立資料幀。

參考資料

你會學到什麼

  • 了解PySpark SQL及其進階功能
  • 在PySpark SQL中使用SQL和HiveQL
  • 使用結構化流媒體
  • 優化PySpark SQL
  • 掌握圖形架構和圖形處理

本書對象

資料科學家,Python程式員和SQL程式員。