国外课栈 - 国外电子信息技术视频教程、电子书和博文栈
PySpark SQL指南 
PySpark SQL指南
类别 : 电子书
格式 : PDF
订阅支付  提交订阅
概述

  • 详细介绍PySpark SQL和Dataframe
  • 包括使用来自最常用的SQL和NoSQL数据库的PySpark SQL的IO操作
  • 使用PySpark SQL进行数据预处理的详细讨论
  • 使用图框的图基算法的问题解决方法

使用问题解决方法,通过PySpark SQL,图形框架和图形数据处理进行数据分析。本书提供了与数据框,数据处理摘要和探索性分析有关的问题的解决方案。您将使用图形框架提高图形数据分析的技能,并了解如何优化PySpark SQL代码。

PySpark SQL指南始于从不同类型的数据源创建数据帧,数据聚合和汇总以及使用PySpark SQL进行探索性数据分析的指南。您还将发现如何使用图框解决图分析中的问题。

完成本书后,您将拥有完成所有PySpark SQL任务的代码,包括使用来自不同文件格式以及SQL或NoSQL数据库的数据创建数据框。

您将学到什么

  • 了解PySpark SQL及其高级功能
  • 将SQL和HiveQL与PySpark SQL一起使用
  • 使用结构化流
  • 优化PySpark SQL
  • 主图框和图处理

总目录

  • PySpark SQL简介
  • 安装
  • PySpark SQL中的IO
  • 在PySpark SQL DataFrames上的操作
  • 使用PySparkSQL进行数据合并和数据聚合
  • SQL,NoSQL和PySparkSQL
  • 优化PySpark SQL
  • 结构化流
  • GraphFrames

会员登录
登录
我的资料
留言
回到顶部