排序: 最新 热门 引用
cs.AI 2606.19911

Multi-Agent Transactive Memory

提出多智能体交易记忆(MATM)框架,通过共享轨迹提升异构智能体群体的任务表现,实验显示成功率提升8%,步骤减少0.59。

To Eun Kim, Xuhong He, Dishank Jain 等

2026-06-18 17
cs.AI 2606.11173

The Role of Feedback Alignment in Self-Distillation

本论文提出反馈对齐机制在自蒸馏中的作用,通过三种反馈设计(二元奖励、参考解、逐步批评)验证,结构对齐显著提升性能。

Semih Kara, Oğuzhan Ersoy

2026-06-10 68
cs.AI 2605.28807

Calibrating Conservatism for Scalable Oversight

提出CCO,通过集成多重监督信号,利用Conformal Decision Theory实现在线校准,确保AI系统行为符合预设安全目标。

William Overman, Mohsen Bayati

2026-05-28 122