国外课栈 - 国外电子信息技术视频教程、电子书和博文栈
使用Google BigQuery设计数据仓库解决方案 
使用Google BigQuery设计数据仓库解决方案
类别 : 视频教程
格式 : MP4
订阅支付  提交订阅
概述

BigQuery是Google Cloud Platform在云端的数据仓库。在本课程中,您将学习如何在几乎没有管理开销的情况下使用BigQuery处理大型数据集。

组织存储海量数据,这些数据是从各种各样的来源收集来的。BigQuery具有无服务器功能和自动缩放功能,可支持PB级的快速查询。BigQuery还支持流数据,可使用可视化工具,并与Datalab笔记本中运行的Python脚本无缝交互。

在本课程中,使用Google BigQuery设计数据仓库解决方案,您将学习如何在几乎没有与集群和节点供应相关的管理费用的情况下,使用BigQuery处理大型数据集。首先,您将首先概述Google Cloud上的存储产品套件以及BigQuery所处的独特位置。您将看到BigQuery与GCP上的Cloud SQL,BigTable和数据存储的比较,以及与Amazon Redshift的不同。接下来,您将在BigQuery中创建与RDMBS中的数据库等效的数据集,并在存储实际数据的数据集中创建表。您将使用Web控制台和命令行使用BigQuery。您将使用CSV,JSON和AVRO格式将数据加载到BigQuery表中,并查看如何执行和管理作业。最后,您将通过探索使用嵌套和重复字段的高级分析查询来结束本文。您将对数据运行聚合操作,并使用高级窗口功能。您将使用Python中的客户端库以编程方式访问BigQuery,并使用Data Studio可视化数据。在本课程的最后,您将轻松使用BigQuery中存储的巨大数据集,执行分析查询,执行分析。

时长:2h48m


BigQuery


会员登录
登录
我的资料
留言
回到顶部