排序: 最新 热门 引用
cs.LG 2604.18578

Bounded Ratio Reinforcement Learning

提出了有界比率强化学习(BRRL)框架,实验表明在MuJoCo等环境中性能优于PPO。

Yunke Ao, Le Chen, Bruce D. Lee 等

2026-04-21 24
math.ST 2604.18441

Conformal Robust Set Estimation

提出了一种基于半质量半径的稳健保形预测方法,适用于重尾分布。

Alejandro Cholaquidis, Emilien Joly, Leonardo Moreno

2026-04-20 20
stat.ML 2604.18420

Spectral bandits for smooth graph functions

提出了用于平滑图函数的谱Bandit算法,在有效维度上实现线性和次线性扩展。

Michal Valko, Rémi Munos, Branislav Kveton 等

2026-04-20 118 引用 31