国外课栈 - 国外电子信息技术视频教程、电子书和博文栈
使用R进行探索性数据分析 
使用R进行探索性数据分析
类别 : 视频教程
格式 : MP4
订阅支付  提交订阅
概述

利用EDA和R有效地分析数据的技能

学习  

  • 设置数据和代码以避免错误并确保可重复性
  • 真正了解数据的结构和内容
  • 建立清晰的图表以使用ggplot评估数据的分布
  • 使用dplyr构造变量汇总
  • 实施数据清理和验证任务,为数据挖掘活动做好准备
  • 测试假设或检查与特定模型有关的假设
  • 估计参数并计算误差范围

关于  

数据分析中最多的错误和失败源于未执行适当的探索性数据分析(EDA)。缺乏EDA知识可能使您面临从数据分析中得出不正确且可能有害的结论的巨大风险。

在本课程中,您将学习EDA如何帮助您得出结论,以便更好地理解数据并实施正确的技术。我们将首先简要介绍EDA,它的重要性以及与BI工具相比的优势。使用dplyr和ggplot2之类的R库,我们将生成见解并提出相关问题进行调查,并使用可视化有效地传达结果。您将学习如何发现缺失的数据和错误,验证假设并确定用于理解问题的模式。基于此,您将能够选择正确的ML模型用于数据。

在课程结束时,您将能够快速了解并解释将要呈现的各种数据集,并轻松了解如何处理和使用它们,以便为进行进一步的建模活动做好准备。

请注意,R和R Studio的基础知识以及一些描述性统计知识是从该课程中获得最大收益的关键。

特征  

  • 探索最受欢迎和最先进的R软件包,使您处于技术的最前沿
  • 了解第一次查看数据时需要做的事情,直到准备好进行建模活动的过程,以及一路避免的陷阱
  • 包括用于实践课程中引入的每个概念的数据和代码,以巩固您的学习并将EDA变成一种习惯

总目录(4时43分)

  • 做好准备:如何组织EDA工作区
  • 研究数据的结构
  • 不要踩鸡蛋:使用数据之前检查数据质量
  • 汇总数据并调查分布
  • 调查变量之间的关系和模式
  • 测试模型假设
  • 建立快速EDA精益报告

R


会员登录
登录
我的资料
留言
回到顶部