译文语言

机器学习中的最优传输

本文系统介绍了最优传输（Optimal Transport）理论在机器学习中的核心概念与应用，涵盖Wasserstein距离、熵正则化、Sinkhorn算法等关键技术。作者从基础数学原理出发，逐步讲解如何将OT方法用于领域适应、生成模型、聚类分析等机器学习任务，为研究者提供了从理论到实践的完整知识框架。

背景速读

- **最优传输（Optimal Transport，OT）** 是一个数学问题：给定两个概率分布，找到将其中一个“搬运”成另一个的最经济方式（最小化总“运输成本”）。它最早由法国数学家 Monge（18世纪）提出，后由 Kantorovich（20世纪）发展为线性规划形式，两人都是各自时代的顶级数学家。 - 近十年，OT 在机器学习领域变得非常热门，因为它能自然地比较两个分布之间的差异（比传统的 KL 散度等更几何化），且可以处理离散与连续分布、加标签与未加标签的数据。 - 这篇讲义是 Gabriel Peyré（法国 CNRS 研究员、OT 与 ML 交叉领域的权威学者）为机器学习从业者写的系统性介绍。它覆盖了 OT 的基础数学（对偶性、Wasserstein 距离、熵正则化等）以及关键应用（生成模型、领域自适应、梯度流等）。 - 对于关注前沿 ML 但非数学出身的读者来说，OT 是理解许多现代算法（如 WGAN、Gromov-Wasserstein 对齐、Sinkhorn 算法）背后原理的必备背景知识。