作者文章归档:course

遗憾-ML


在机器学习(ML)中,“遗憾”(Regret)是衡量在线学习或强化学习算法性能的重要指标,表示算法累积损失与最优策略之间的差距。以下是近年来的关键研究进展及其应用场景的总结:


1. 在线线性规划与Regret优化

  • 突破性框架:针对在线线性规划问题,研究提出了一种新框架,当线性规划对偶问题满足特定误差边界条件时,一阶学习算法的Regret可突破传统的$\mathcal{O}(\sqrt{T})$限制。在连续支持场景下实现$o(\sqrt{T})$ Regret,而在有限支持场景下达到$\mathcal{O}(\log T)$ Regret,显著优于现有方法。
  • 应用场景:适用于资源分配和...

Read more