EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents
提出EEVEE框架,通过路由器和提示集实现多数据集测试时提示学习,提升模型在异质任务流中的鲁棒性,平均提升10.38-24.32分。
Weixian Xu, Shilong Liu, Mengdi Wang
提出EEVEE框架,通过路由器和提示集实现多数据集测试时提示学习,提升模型在异质任务流中的鲁棒性,平均提升10.38-24.32分。
Weixian Xu, Shilong Liu, Mengdi Wang
提出Data2Story多智能体框架,将数据转化为可验证的多模态新闻,强调证据追溯和互动性。
Kevin Qinghong Lin, Batu EI, Yuhong Shi 等
本论文提出反馈对齐机制在自蒸馏中的作用,通过三种反馈设计(二元奖励、参考解、逐步批评)验证,结构对齐显著提升性能。
Semih Kara, Oğuzhan Ersoy
本文将GP-UCB与DEC在RKHS带宽中的算法复杂度与极小极大复杂度统一在MAIR框架下,揭示两者的本质差异。
Yunbei Xu
Piper通过策略解耦与中间表示实现分布式训练的灵活性,优化多策略联合调度,提升性能与内存效率。
Megan Frisella, Shubham Tiwari, Andy Ruan 等
提出COGENT,基于神经常微分方程的连续图模拟器,用于长远地理空间网格的物理预测。
Zesheng Liu, Maryam Rahnemoonfar
引入Itô映射实现任意步长SDE采样,支持条件采样与控制,提升生成多样性与效率。
Zhengkai Pan, Peter Potaptchik, Wenxi Yao 等
JOIN系统通过 opposition-score 和任务导向操控性实现异构双臂协作,成功率达95%。
Drake Moore, Matt Cheng, Xiang Zhi Tan 等
提出一种高效学习漂移半空间的算法,误差上界为η + ˜O(Δ^{1/3}/γ),在Massart噪声下实现近似最优。
Mingchen Ma, Guyang Cao, Jelena Diakonikolas 等
提出MOFA-VTON,通过用户草图实现细粒度虚拟试衣,超越传统布局限制。
Xiaoyu Han, Chenyang Wang, Jing Wang 等
本文提出基于描述符的分布式多地面机器人(UGV)探索框架,结合环路检测和层次规划,显著提升资源有限环境中的探索效率与定位精度,关键指标AR@1达89.9%。
Zhiwei Li, Haiou Liu, Xijun Zhao 等
VISTA引入融合UI与API的混合用户模拟器,采用六项指标评估交互真实性与能力覆盖,显著优于现有方法。
Yunan Lu, Ryan Shea, Yusen Zhang 等
提出HiViG,结合历史状态追踪与视觉基础的测试时干预框架,提升GUI任务成功率,Qwen3-VL-32B提升5.8%,Gemini-3-Flash提升9%。
Jaewoo Lee, Zaid Khan, Archiki Prasad 等
本文提出基于演化替代矩阵的灵活核函数,利用高效高斯过程模型预测蛋白质性质,显著优于嵌入基础模型的方案。
Martin Jankowiak, Yerdos Ordabayev, Rudraksh Tuwani 等
本文提出基于大语言模型(LLM)的自主驾驶成本优化框架,通过自然语言交互实现动态调节,结合MPPI控制实现安全与个性化驾驶。
Diego Martinez-Baselga, Khaled Mustafa, Javier Alonso-Mora
miniReranker通过视觉缓存重用和交互稀疏技术,在多模态重排序中实现了<1%的运行时间,性能保持在96%以上。
Yingqi Fan, Xuan Lu, Anhao Zhao 等
提出SkillResolve-Bench,通过661对技能对比和7,982候选池,有效衡量并减少相同能力模糊带来的执行风险,提升召回率和安全性。
Jiandong Ding
MemoryVLA++结合记忆与想象实现机器人长时序建模,显著提升任务成功率。
Hao Shi, Weiye Li, Bin Xie 等
本文提出DRPO,通过平滑优势加权二次正则化改善LLM强化学习中的偏差正则,提升训练稳定性和效率。
Jiarui Yao, Xiangxin Zhou, Penghui Qi 等
iMaC将未来机器人动作转化为图像控制,提升视频预测和任务执行的空间表达能力。
Zhenyu Wu, Xiuwei Xu, Yukun Zhou 等