排序: 最新 热门 引用
cs.CL 2606.19336

Learning User Simulators with Turing Rewards

提出基于图灵奖励的强化学习方法Turing-RL,用于训练人类用户模拟器,显著优于传统匹配方法。

Yingshan Susan Wang, Cedegao E. Zhang, Linlu Qiu 等

2026-06-18 23
cs.CL 2606.13634

Operads for compositional reasoning in LLMs

提出运算子框架Q,用于描述问答中的问题分解,结合操作一致性提升多步推理可靠性。

Nathaniel Bottman, Kyle Richardson

2026-06-12 1 引用 61
cs.CL 2606.07342

LLM-Guided Evolution for Medical Decision Pipelines

本文提出基于LLM引导的MAP-Elites演化方法,用于优化医疗决策流程,包括急诊分诊、互动咨询和医学影像分类,显著提升性能。

Ivan Sviridov, Artem Oskin, Ivan Panin 等

2026-06-05 61
cs.CL 2606.06380

Emergent Language as an Approach to Conscious AI

提出基于多智能体强化学习的涌现语言方法,观察无先验条件下的意识相关结构,发现自指通信和回声检测电路。

Zengqing Wu, Chuan Xiao

2026-06-05 97