排序: 最新 热门 引用
physics.optics 2603.17049

Attractor-Keyed Memory

吸引子键控存储结合选择与记忆访问,减少稀疏路由架构中的延迟与能耗。

Natalia G. Berloff

2026-03-18 79
cs.CV 2603.16870

Demystifing Video Reasoning

通过Chain-of-Steps机制,视频生成模型在扩散去噪步骤中展现推理能力。

Ruisi Wang, Zhongang Cai, Fanyi Pu 等

2026-03-18 1 引用 126
cs.LG 2603.16867

Efficient Reasoning on the Edge

使用LoRA适配器和强化学习实现小型LLM的高效推理,显著降低响应长度。

Yelysei Bondarenko, Thomas Hehn, Rob Hesselink 等

2026-03-18 108
cs.CL 2603.15619

Mixture-of-Depths Attention

混合深度注意力(MoDA)在1.5B参数模型上提升了2.11%的下游任务表现,计算开销仅增加3.7%。

Lianghui Zhu, Yuxin Fang, Bencheng Liao 等

2026-03-17 106