wjt.im

August 1, 2024Last Updated: August 13, 2024

【MLAPP】 1. Introduction

ML0.3 min to read

1.1 机器学习概述

我们定义机器学习是一种方法集合——可以自动识别数据中的模式,然后利用潜在的模式预测未来或做出决策。这本书认为解决此类问题的最佳方法是使用“概率论”。本书将描述适用于各种数据和任务的概率模型,还将介绍用于学习和使用此类概率的算法。

然而,应该指出的是,即使有一个明显庞大的数据集,某些感兴趣的案例的有效数据点的数量可能很小(长尾特性)。这意味着即使在大数据时代,本书所讨论的关于从相对较小的样本量进行概括的核心统计问题仍然非常重要。

机器学习通常分为两种类型。在预测或有监督学习方法中,目标是给定一组标记的输入输出对,学习从输入到输出的映射。这里称