Efficient Training-Free Multi-Token Prediction via Embedding-Space Probing
通过嵌入空间探测实现高效的无训练多标记预测,提升LLaMA3的接受长度12%。
Raghavv Goel, Mukul Gagrani, Mingu Lee 等
通过嵌入空间探测实现高效的无训练多标记预测,提升LLaMA3的接受长度12%。
Raghavv Goel, Mukul Gagrani, Mingu Lee 等
RAMP通过强化学习自适应混合精度量化,实现设备上LLM高效推理,提升6%模型大小和1-3%质量。
Arpit Singh Gautam, Saurabh Jha
自适应领域模型通过贝叶斯蒸馏和温暖旋转实现几何和神经形态AI的高效训练。
Houston Haynes
大语言模型作为神经数字生态系统的语义接口和伦理中介,提出神经语言整合新范式。
Alexander V. Shenderuk-Zhidkov, Alexander E. Hramov
实现预测编码网络的可综合RTL架构,支持局部预测误差动态,硬件直接执行学习更新。
Timothy Oh
利用二次代理吸引子优化粒子群算法,提升全局收敛性和鲁棒性。
Maurizio Clemente, Marcello Canova
优化嵌入式主动多保真代理学习用于多条件翼型形状优化,巡航效率提高41.05%,起飞升力提高20.75%。
Isaac Robledo, Alberto Vilariño, Arnau Miró 等
吸引子键控存储结合选择与记忆访问,减少稀疏路由架构中的延迟与能耗。
Natalia G. Berloff
通过Chain-of-Steps机制,视频生成模型在扩散去噪步骤中展现推理能力。
Ruisi Wang, Zhongang Cai, Fanyi Pu 等
MessyKitchens通过MOD算法实现了高精度的单目3D场景重建,显著提升了物体间接触的物理合理性。
Junaid Ahmed Ansari, Ran Ding, Fabio Pizzati 等
使用LoRA适配器和强化学习实现小型LLM的高效推理,显著降低响应长度。
Yelysei Bondarenko, Thomas Hehn, Rob Hesselink 等
SegviGen利用3D生成模型进行3D部件分割,仅需0.32%标注数据即可提升40%交互分割性能。
Lin Li, Haoran Feng, Zehuan Huang 等
ManiTwin通过单张图像生成100K高质量3D数字资产,支持大规模机器人操作数据生成。
Kaixuan Wang, Tianxing Chen, Jiawei Liu 等
BrickSim是一种物理模拟器,能实时模拟积木组件的装配和崩溃,准确率达100%。
Haowei Wen, Ruixuan Liu, Weiyi Piao 等
M^3方法结合多视图基础模型和单目高斯喷射SLAM,实现64.3% ATE RMSE降低。
Kerui Ren, Guanghao Li, Changjian Jiang 等
LEAFE框架通过反思性经验内化恢复能力,提升长远任务中的Pass@k表现。
Rui Ge, Yichao Fu, Yuyang Qian 等
使用竞争性强化学习的PPO算法实现无人机拦截,捕获率超越基线。
Timothée Gavin, Simon Lacroix, Murat Bronz
PUMA模型在动态环境中实现了6.3%的成功率提升,结合历史光流和世界查询。
Heng Fang, Shangru Li, Shuhan Wang 等
混合深度注意力(MoDA)在1.5B参数模型上提升了2.11%的下游任务表现,计算开销仅增加3.7%。
Lianghui Zhu, Yuxin Fang, Bencheng Liao 等
HorizonMath通过自动验证框架评估AI在数学发现上的进展,GPT 5.4 Pro在两个问题上取得突破。
Erik Y. Wang, Sumeet Motwani, James V. Roggeveen 等