Paper 解读 - Arxiv 论文中文解读平台

cs.AI 2606.20526

DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programs

DeepSWIP利用神经材料化与WMC实现深度概率逻辑程序的单世界反事实推理，提升推理速度2.14倍。

Saimun Habib, Vaishak Belle, Fengxiang He

2026-06-19 31

cs.AI 2606.19911

Multi-Agent Transactive Memory

提出多智能体交易记忆（MATM）框架，通过共享轨迹提升异构智能体群体的任务表现，实验显示成功率提升8%，步骤减少0.59。

To Eun Kim, Xuhong He, Dishank Jain 等

2026-06-18 19

cs.AI 2606.18191

DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction

提出DRFLOW基准，结合7项指标评估个性化深度研究工作流预测，涵盖100任务和1246步骤。

Md Tawkat Islam Khondaker, Raymond Li, Muhammad Abdul-Mageed 等

2026-06-17 26

cs.AI 2606.14654

Abstracting Cross-Domain Action Sequences into Interpretable Workflows

提出WorkflowView框架，利用大语言模型（LLMs）将低级行为序列抽象为高层次活动，在浏览器、MOOC和Word文档中实现高准确性（最高F1=0.90），实现跨域通用性。

Gaurav Verma, Scott Counts

2026-06-13 39

cs.AI 2606.13670

Automated reproducibility assessments in the social and behavioral sciences using large language models

利用大语言模型（如Claude 4.7）自动评估社会行为科学研究的可复现性，通过效果量匹配和结论一致性验证，提升审查效率。

Tobias Holtdirk, Pietro Marcolongo, Anna Steinberg Schulten 等

2026-06-12 91

cs.AI 2606.11173

The Role of Feedback Alignment in Self-Distillation

本论文提出反馈对齐机制在自蒸馏中的作用，通过三种反馈设计（二元奖励、参考解、逐步批评）验证，结构对齐显著提升性能。

Semih Kara, Oğuzhan Ersoy

2026-06-10 69

cs.AI 2606.11078

A History-Aware Visually Grounded Critic for Computer Use Agents

提出HiViG，结合历史状态追踪与视觉基础的测试时干预框架，提升GUI任务成功率，Qwen3-VL-32B提升5.8%，Gemini-3-Flash提升9%。

Jaewoo Lee, Zaid Khan, Archiki Prasad 等

2026-06-10 93

cs.AI 2606.07489

How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

采用个体任务框架，利用Perplexity的搜索与Computer数据，验证AI代理提升自动化、效率与工作范围的实证效果。

Jeremy Yang, Kate Zyskowski, Noah Yonack 等

2026-06-06 115

cs.AI 2606.06473

MLEvolve: A Self-Evolving Framework for Automated Machine Learning Algorithm Discovery

MLEvolve是一种基于大语言模型的自我演化框架，用于端到端机器学习算法自动发现，在12小时预算内达成65.3%的奖牌率。

Shangheng Du, Xiangchao Yan, Jinxin Shi 等

2026-06-05 77

cs.AI 2606.02530

SafeSteer: Localized On-Policy Distillation for Efficient Safety Alignment

SafeSteer通过局部化的策略蒸馏，仅在安全标记上调整，有效平衡安全性与模型能力，显著减少对通用数据的依赖。

Hao Li, Jingkun An, Zijun Song 等

2026-06-02 118

cs.AI 2606.02484

Iteris: Agentic Research Loops for Computational Mathematics

Iteris为计算数学中的开放问题设计的智能研究系统，通过生成数值证据和证明草稿，辅以专家验证，推动理论验证。

Leheng Chen, Zihao Liu, Wanyi He 等

2026-06-02 189

cs.AI 2605.31581

Choosing the Lens: Strategic Perspective Activation in Context-Dependent Argumentation

提出基于情境的论证框架（CDAFs），通过激活不同视角实现策略性攻击控制，分析复杂性界限。

Albert Sadowski, Jarosław A. Chudziak

2026-05-30 76

cs.AI 2605.30344

Tiny but Trusted: Efficient Vision-Language Reasoning for Time-Series Anomaly Detection

提出VisAnomReasoner，通过微调大规模视觉-语言模型实现时间序列异常检测，Precision提升21.23%，F1提升23.87%。

Xiaona Zhou, Muntasir Wahed, Tianjiao Yu 等

2026-05-29 97

cs.AI 2605.30345

SchGen: PCB Schematic Generation with Semantic-Grounded Code Representations

提出SchGen模型，基于语义编码的PCB原理图生成，从自然语言请求到可编辑电路图，实现82%的有效电路率。

Qinpei Luo, Ruichun Ma, Xinyu Zhang 等

2026-05-29 239

cs.AI 2605.28807

Calibrating Conservatism for Scalable Oversight

提出CCO，通过集成多重监督信号，利用Conformal Decision Theory实现在线校准，确保AI系统行为符合预设安全目标。

William Overman, Mohsen Bayati

2026-05-28 122

cs.AI 2605.27366

MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation

MUSE-Autoskill通过技能生命周期管理提升任务成功率，技能复用率达68.4%。

Huawei Lin, Peng Li, Jie Song 等

2026-05-27 394

cs.AI 2605.27361

Natural Language Query to Configuration for Retrieval Agents

BRANE方法通过LLM提取查询特征，实现MuSiQue等数据集89%成本节省的动态检索配置优化。

Melissa Z. Pan, Negar Arabzadeh, Mathew Jacob 等

2026-05-27 62

cs.AI 2605.22794

MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

MOSS系统通过源码层自我改写，在OpenClaw上单轮演化将四任务平均评分从0.25提升至0.61。

Qianshu Cai, Yonggang Zhang, Xianzhang Jia 等

2026-05-22 591

cs.AI 2605.22786

LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems

LCGuard通过对Transformer KV缓存进行对抗训练变换，有效降低多智能体系统中的敏感信息重构率，保持任务性能。

Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas 等

2026-05-22 314

cs.AI 2605.12481

ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents

ToolCUA通过分阶段训练实现GUI-工具路径选择，提升46.85%准确率。

Xuhao Hu, Xi Zhang, Haiyang Xu 等

2026-05-13 214