Vector Policy Optimization: Training for Diversity Improves Test-Time Search
提出Vector Policy Optimization(VPO)算法,通过训练多样化策略显著提升测试时搜索性能,最高提升达20%以上。
Ryan Bahlous-Boldi, Isha Puri, Idan Shenfeld 等
提出Vector Policy Optimization(VPO)算法,通过训练多样化策略显著提升测试时搜索性能,最高提升达20%以上。
Ryan Bahlous-Boldi, Isha Puri, Idan Shenfeld 等
AwareVLN提出自我意识推理机制,R2R-CE Val-Unseen上NE降至4.02,显著优于现有方法。
Wenxuan Guo, Xiuwei Xu, Yichen Liu 等
提出基于3D高斯点云持久世界模型和Transformer序列策略的好奇心驱动3D探索,HM3D测试提升3D覆盖率至74.94%。
Lily Goli, Justin Kerr, Daniele Reda 等
GesVLA结合手势与视觉语言动作模型,实验证明在复杂场景中目标定位准确率提升至94.3%。
Wenxuan Guo, Ziyuan Li, Meng Zhang 等
匹配原理:通过估计部署环境无关扰动协方差矩阵,正则化编码器Jacobian,实现鲁棒表示学习,7B模型实验验证。
Vishal Rajput
提出基于核密度估计梯度的保守漂移方法,实现有限粒子收敛率,最优速率达N^{-(2-β)/(2(d+4-β))}
Krishnakumar Balasubramanian
MOSS系统通过源码层自我改写,在OpenClaw上单轮演化将四任务平均评分从0.25提升至0.61。
Qianshu Cai, Yonggang Zhang, Xianzhang Jia 等
LCGuard通过对Transformer KV缓存进行对抗训练变换,有效降低多智能体系统中的敏感信息重构率,保持任务性能。
Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas 等
基于BBC新闻,评测六款AI聊天机器人对新兴事实的多语言检索与回答准确率,最高达95.6%。
Mirac Suzgun, Emily Shen, Federico Bianchi 等
DeltaBox通过DeltaFS和DeltaCR实现AI代理毫秒级增量状态检查点与回滚,SWE-bench测试中检查点14ms,回滚5ms。
Yunpeng Dong, Jingkai He, Yuze Hou 等
DecQ通过引入细节浓缩查询,提升RAE重建PSNR至22.76dB,生成FID降至1.41,计算开销仅增3.9%。
Tianhang Wang, Yitong Chen, Wei Song 等
基于KairosQA数据集,6B参数模型顺序预训练提升时间敏感知识准确率,较随机打乱提升F1达15%。
Pilchen Hippolyte, Fabre Romain, Signe Talla Franck 等
StructuredSemanticSearch通过表格驱动模型搜索,597条查询实验覆盖率提升
Zhengyuan Dong, Renée J. Miller
基于多智能体强化学习的联盟训练,实现22m/s高速四旋翼安全竞速,碰撞率降低50%。
Ismail Geles, Leonard Bauersfeld, Markus Wulfmeier 等
WorldKV提出基于KV缓存的检索与压缩,实现2倍吞吐量下持久一致的世界记忆。
Jung Yi, Minjae Kim, Paul Hyunbin Cho 等
AnyMo提出基于几何感知的设置无关人体运动建模,零样本识别提升11.7%,跨模态检索MRR提升28.6%。
Baiyu Chen, Zechen Li, Wilson Wongso 等
TriSweep四无人机群框架实现0.25米距离掩码AES-128电磁侧信道分析,关键排名降至18±1.7。
Eric Yocam, Varghese Vaidyan
提出Branch-Stochastic MPC结合场景聚类,实现多模态不确定性下自动驾驶运动规划,仿真提升安全性与实时性。
Zekun Xing, Ramkrishna Chaudhari, Marion Leibold 等
提出量子遗传负选择算法(QGNSA),在Metaverse金融交易数据集上异常检测准确率提升显著。
Giancarlo P. Gamberi, Calebe P. Bianchini
CUActSpot基准测试通过数据合成和多模态评估提升GUI复杂交互性能,Phi-Ground-Any-4B模型表现优异。
Miaosen Zhang, Xiaohan Zhao, Zhihong Tan 等