国外课栈 - 跨学科知识视角栈
机器学习中概率和统计实践
机器学习中概率和统计实践
类别 : 视频教程
咨询
概述

为您提供对概率论和统计建模的实用、动手理解,重点是机器学习应用。

  • 了解用于表示给定数据类别的适当变量类型和概率分布

  • 计算用于描述概率分布的所有标准汇总指标,以及用于评估分布之间关系的标准技术

  • 应用信息论来量化存在于给定概率分布的噪声中的有价值信号的比例

  • 使用基本统计工具(例如 t 检验、方差分析和 R 平方)对机器学习算法的输入和输出进行假设和批判性评估

  • 了解频率论和贝叶斯统计的基础知识,并了解其中一种方法何时适合您正在解决的问题

  • 使用历史数据来使用回归模型预测未来,这些回归模型利用了频率统计理论(对于较小的数据集)和现代机器学习理论(对于较大的数据集),包括为什么我们可能要考虑将深度学习应用于给定的问题

  • 深入了解预测统计模型和机器学习算法背后发生的事情

内容

  • 概率简介首先向您介绍机器学习基础系列并介绍什么是概率论。然后,介绍最基本的概率概念,并通过理解练习加以加强。本课以贝叶斯统计和频率统计的比较结束,并讨论了概率在机器学习中的应用。

  • 随机变量这是一个基本的概率概念,是理解后面课程的先决条件。首先探索离散和连续变量以及它们对应的概率分布。本课以随机变量的期望值的计算结束。

  • 描述分布涵盖了集中趋势的度量、分位数、盒须图、离散度量和相关性度量。

  • 概率之间的关系探讨了概率之间的核心关系,包括联合分布、边际概率和条件概率、链式法则和独立性。

  • 机器学习中的分布现在已引导您大致掌握概率论,在此,详细介绍了机器学习中最重要的概率分布,包括均匀分布和正态分布,以及中心极限定理的关键概念. 他还介绍了对数正态分布、指数分布、离散分布和泊松分布,以及分布的混合以及如何准备分布以输入到机器学习模型中。

  • 信息论这是一个与概率论相关的研究领域,其中包括一些在机器学习中无处不在的关键概念。具体来说,他定义了自信息、香农熵、KL 散度和交叉熵。

  • 统计学简介将从一般概率论转移到概率论促进的统计模型。首先解释了统计如何应用于机器学习,并回顾了您必须了解的最基本的概率理论才能继续前进。然后介绍了新的统计概念,特别是z分数和p 值。

  • 比较均值教您使用概率和统计来比较分布与t检验。他涵盖了所有关键类型,包括单样本、独立和配对品种。提供了t检验在机器学习中的具体应用,然后通过对相关概念(即置信区间和方差分析)的讨论来结束课程。

  • 相关性以关于推断因果关系和纠正多重比较的重要讨论结束了课程。

  • 回归它将前面的课程与实际的、真实的回归演示结合在一起,这是一种强大的、高度可扩展的预测方法。区分独立变量和因变量,并使用线性回归来预测连续变量——首先使用单个模型特征,然后使用多个模型特征,包括离散特征。

  • 贝叶斯统计提供了有关频率统计或贝叶斯统计何时可能是您正在解决的问题的合适选项的指南。然后介绍了最基本的贝叶斯概念。最后,提供了学习概率和统计的资源。