Paper 解读 - Arxiv 论文中文解读平台

cs.LG 2605.22817

Vector Policy Optimization: Training for Diversity Improves Test-Time Search

提出Vector Policy Optimization（VPO）算法，通过训练多样化策略显著提升测试时搜索性能，最高提升达20%以上。

Ryan Bahlous-Boldi, Isha Puri, Idan Shenfeld 等

2026-05-22 58

cs.RO 2605.22816

AwareVLN: Reasoning with Self-awareness for Vision-Language Navigation

AwareVLN提出自我意识推理机制，R2R-CE Val-Unseen上NE降至4.02，显著优于现有方法。

Wenxuan Guo, Xiuwei Xu, Yichen Liu 等

2026-05-22 59

cs.LG 2605.22814

Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration

提出基于3D高斯点云持久世界模型和Transformer序列策略的好奇心驱动3D探索，HM3D测试提升3D覆盖率至74.94%。

Lily Goli, Justin Kerr, Daniele Reda 等

2026-05-22 49

cs.RO 2605.22812

GesVLA: Gesture-Aware Vision-Language-Action Model Embedded Representations

GesVLA结合手势与视觉语言动作模型，实验证明在复杂场景中目标定位准确率提升至94.3%。

Wenxuan Guo, Ziyuan Li, Meng Zhang 等

2026-05-22 55

cs.LG 2605.22800

The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning

匹配原理：通过估计部署环境无关扰动协方差矩阵，正则化编码器Jacobian，实现鲁棒表示学习，7B模型实验验证。

Vishal Rajput

2026-05-22 53

stat.ML 2605.22795

Finite-Particle Convergence Rates for Conservative and Non-Conservative Drifting Models

提出基于核密度估计梯度的保守漂移方法，实现有限粒子收敛率，最优速率达N^{-(2-β)/(2(d+4-β))}

Krishnakumar Balasubramanian

2026-05-22 91

cs.AI 2605.22794

MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

MOSS系统通过源码层自我改写，在OpenClaw上单轮演化将四任务平均评分从0.25提升至0.61。

Qianshu Cai, Yonggang Zhang, Xianzhang Jia 等

2026-05-22 593

cs.AI 2605.22786

LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems

LCGuard通过对Transformer KV缓存进行对抗训练变换，有效降低多智能体系统中的敏感信息重构率，保持任务性能。

Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas 等

2026-05-22 316

cs.CL 2605.22785

Evaluating Commercial AI Chatbots as News Intermediaries

基于BBC新闻，评测六款AI聊天机器人对新兴事实的多语言检索与回答准确率，最高达95.6%。

Mirac Suzgun, Emily Shen, Federico Bianchi 等

2026-05-22 169

cs.OS 2605.22781

DeltaBox: Scaling Stateful AI Agents with Millisecond-Level Sandbox Checkpoint/Rollback

DeltaBox通过DeltaFS和DeltaCR实现AI代理毫秒级增量状态检查点与回滚，SWE-bench测试中检查点14ms，回滚5ms。

Yunpeng Dong, Jingkai He, Yuze Hou 等

2026-05-22 56

cs.CV 2605.22777

DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders

DecQ通过引入细节浓缩查询，提升RAE重建PSNR至22.76dB，生成FID降至1.41，计算开销仅增3.9%。

Tianhang Wang, Yitong Chen, Wei Song 等

2026-05-22 45

cs.CL 2605.22769

Understanding Data Temporality Impact on Large Language Models Pre-training

基于KairosQA数据集，6B参数模型顺序预训练提升时间敏感知识准确率，较随机打乱提升F1达15%。

Pilchen Hippolyte, Fabre Romain, Signe Talla Franck 等

2026-05-22 139

cs.IR 2605.22766

Diversed Model Discovery via Structured Table Discovery

StructuredSemanticSearch通过表格驱动模型搜索，597条查询实验覆盖率提升

Zhengyuan Dong, Renée J. Miller

2026-05-22 56

cs.RO 2605.22748

Superhuman Safe and Agile Racing through Multi-Agent Reinforcement Learning

基于多智能体强化学习的联盟训练，实现22m/s高速四旋翼安全竞速，碰撞率降低50%。

Ismail Geles, Leonard Bauersfeld, Markus Wulfmeier 等

2026-05-22 81

cs.CV 2605.22718

WorldKV: Efficient World Memory with World Retrieval and Compression

WorldKV提出基于KV缓存的检索与压缩，实现2倍吞吐量下持久一致的世界记忆。

Jung Yi, Minjae Kim, Paul Hyunbin Cho 等

2026-05-22 51

cs.CV 2605.22715

AnyMo: Geometry-Aware Setup-Agnostic Modeling of Human Motion in the Wild

AnyMo提出基于几何感知的设置无关人体运动建模，零样本识别提升11.7%，跨模态检索MRR提升28.6%。

Baiyu Chen, Zechen Li, Wilson Wongso 等

2026-05-22 50

cs.CR 2605.22709

TriSweep: A Four-Drone Swarm Framework for Electromagnetic Side-Channel Analysis

TriSweep四无人机群框架实现0.25米距离掩码AES-128电磁侧信道分析，关键排名降至18±1.7。

Eric Yocam, Varghese Vaidyan

2026-05-22 47

cs.RO 2605.22600

Branch-Stochastic Model Predictive Control for Motion Planning under Multi-Modal Uncertainty with Scenario Clustering

提出Branch-Stochastic MPC结合场景聚类，实现多模态不确定性下自动驾驶运动规划，仿真提升安全性与实时性。

Zekun Xing, Ramkrishna Chaudhari, Marion Leibold 等

2026-05-21 113

cs.NE 2605.22527

Quantum Genetic Optimization for Negative Selection Algorithms in Anomaly Detection

提出量子遗传负选择算法(QGNSA)，在Metaverse金融交易数据集上异常检测准确率提升显著。

Giancarlo P. Gamberi, Calebe P. Bianchini

2026-05-21 53

cs.CV 2605.12501

Covering Human Action Space for Computer Use: Data Synthesis and Benchmark

CUActSpot基准测试通过数据合成和多模态评估提升GUI复杂交互性能，Phi-Ground-Any-4B模型表现优异。

Miaosen Zhang, Xiaohan Zhao, Zhihong Tan 等

2026-05-13 71