机器学习中的最优传输
本文系统介绍了最优传输(Optimal Transport)理论在机器学习中的核心概念与应用,涵盖Wasserstein距离、熵正则化、Sinkhorn算法等关键技术。作者从基础数学原理出发,逐步讲解如何将OT方法用于领域适应、生成模型、聚类分析等机器学习任务,为研究者提供了从理论到实践的完整知识框架。
背景速读
- **最优传输(Optimal Transport,OT)** 是一个数学问题:给定两个概率分布,找到将其中一个“搬运”成另一个的最经济方式(最小化总“运输成本”)。它最早由法国数学家 Monge(18世纪)提出,后由 Kantorovich(20世纪)发展为线性规划形式,两人都是各自时代的顶级数学家。
- 近十年,OT 在机器学习领域变得非常热门,因为它能自然地比较两个分布之间的差异(比传统的 KL 散度等更几何化),且可以处理离散与连续分布、加标签与未加标签的数据。
- 这篇讲义是 Gabriel Peyré(法国 CNRS 研究员、OT 与 ML 交叉领域的权威学者)为机器学习从业者写的系统性介绍。它覆盖了 OT 的基础数学(对偶性、Wasserstein 距离、熵正则化等)以及关键应用(生成模型、领域自适应、梯度流等)。
- 对于关注前沿 ML 但非数学出身的读者来说,OT 是理解许多现代算法(如 WGAN、Gromov-Wasserstein 对齐、Sinkhorn 算法)背后原理的必备背景知识。