排序: 最新 热门 引用
cs.LG 2603.16867

Efficient Reasoning on the Edge

使用LoRA适配器和强化学习实现小型LLM的高效推理,显著降低响应长度。

Yelysei Bondarenko, Thomas Hehn, Rob Hesselink 等

2026-03-18 55