Joint-Centric Dual Contrastive Alignment with Structure-Preserving and Information-Balanced Regularization
HILBERT框架通过双重对比学习和信息均衡正则化,在长序列音频-文本表示学习中实现了显著性能提升。
Habibeh Naderi, Behrouz Haji Soleimani, Stan Matwin
HILBERT框架通过双重对比学习和信息均衡正则化,在长序列音频-文本表示学习中实现了显著性能提升。
Habibeh Naderi, Behrouz Haji Soleimani, Stan Matwin
使用梯度指纹检测和抑制奖励欺骗行为,在数学、代码和逻辑推理基准上表现优异。
Songtao Wang, Quang Hieu Pham, Fangcong Yin 等
原型锚定概念模型(PGCMs)通过视觉原型验证概念对齐,提升解释性。
Stefano Colamonaco, David Debot, Pietro Barbiero 等
Muon优化器在MLP表格深度学习中表现优于AdamW,适合在可接受的训练效率下使用。
Yury Gorishniy, Ivan Rubachev, Dmitrii Feoktistov 等
通过固定点框架分析循环Transformer的稳定性和泛化能力,验证在国际象棋、数独和前缀和任务上的性能。
Asher Labovich
SortedRL通过在线长度感知调度加速大语言模型的强化学习训练,提升效率并提高性能。
Yiqi Zhang, Huiqiang Jiang, Xufang Luo 等
提出Graph Energy Matching (GEM),在分子图生成中超越离散扩散模型。
Michal Balcerak, Suprosana Shit, Chinmay Prabhakar 等
Scaling DoRA通过分解范数和融合内核实现高阶适配,显著降低内存使用,提升速度。
Alexandra Zelenin, Alexandra Zhuravlyova
SPA方法通过精心设计的提示生成大规模合成数据,实现知识注入,表现优异。
Kexian Tang, Jiani Wang, Shaowen Wang 等
提出了一种在排名反馈下进行在线学习的新算法,解决了传统数值反馈缺失的问题。
Mingyang Liu, Yongshan Chen, Zhiyuan Fan 等
通过成本感知的规避框架研究钓鱼检测中的鲁棒性,最小规避成本为2,80%以上的攻击集中在三个低成本特征上。
Julian Allagan, Mohamed Elbakary, Zohreh Safari 等
本文提出了一种基于未来状态-动作访问度量的最大熵探索方法,提高了特征访问和收敛速度。
Adrien Bolland, Gaspard Lambrechts, Damien Ernst
ALIGN通过对抗学习提高跨会话语音神经假体的泛化能力,显著降低音素和单词错误率。
Zhanqi Zhang, Shun Li, Bernardo L. Sabatini 等
RAMP通过强化学习自适应混合精度量化,实现设备上LLM高效推理,提升6%模型大小和1-3%质量。
Arpit Singh Gautam, Saurabh Jha
使用LoRA适配器和强化学习实现小型LLM的高效推理,显著降低响应长度。
Yelysei Bondarenko, Thomas Hehn, Rob Hesselink 等
HorizonMath通过自动验证框架评估AI在数学发现上的进展,GPT 5.4 Pro在两个问题上取得突破。
Erik Y. Wang, Sumeet Motwani, James V. Roggeveen 等
通过有效蒸馏,将xLSTM架构应用于大型语言模型,恢复甚至超越教师模型性能。
Lukas Hauzenberger, Niklas Schmidinger, Thomas Schmied 等
PokeAgent挑战通过Pokemon战斗和RPG环境测试AI决策能力,提供20M+数据集和标准化评估框架。
Seth Karten, Jake Grigsby, Tersoo Upaa 等
PhysMoDPO通过偏好优化生成符合物理的类人运动,提升真实感和任务性能。
Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov 等
采用联合嵌入预测架构(JEPA)在潜在空间中学习物理系统表示,显著提高参数估计精度。
Helen Qu, Rudy Morel, Michael McCabe 等