MXNorm: Reusing MXFP block scales for efficient tensor normalisation
MXNorm通过重用MXFP8块缩放来高效归一化张量,减少32倍归约需求。
Callum McLean, Luke Y. Prince, Alexandre Payot 等
MXNorm通过重用MXFP8块缩放来高效归一化张量,减少32倍归约需求。
Callum McLean, Luke Y. Prince, Alexandre Payot 等
使用MiniRocket和TSFresh等技术,分析和聚类土星卫星轨道数据,揭示其稳定性和共振结构。
Eraldo Pereira Marinho, Nelson Callegari Junior, Fabricio Aparecido Breve 等
开发了一种支持印度孕产妇健康的聊天机器人,使用阶段感知分诊和混合检索,紧急召回率达86.7%。
Smriti Jha, Vidhi Jain, Jianyu Xu 等
DiT-IC通过32倍下采样的扩散变换器实现高效图像压缩,解码速度提升30倍。
Junqi Shi, Ming Lu, Xingchen Li 等
PITMonitor通过混合e过程检测概率积分变换中的分布变化,提供无界监控下的I类错误控制。
Tristan Farran
ESG-Bench通过任务特定的思维链提示策略,显著减少大语言模型在长篇ESG报告分析中的幻觉现象。
Siqi Sun, Ben Peng Wu, Mali Jin 等
ZO-SAM通过零阶优化减少计算开销,提高稀疏训练的效率和鲁棒性。
Jie Ji, Gen Li, Kaiyuan Deng 等
BoSS通过集成多种选择策略,提升深度主动学习的性能,尤其在大规模数据集上表现优异。
Denis Huseljic, Paul Hahn, Marek Herde 等
提出了一种增强可行性的控制屏障函数方法,有效降低多无人机碰撞的不可行性,提高了避障性能。
Qishen Zhong, Junlong Wu, Jian Yang 等
Qwen2.5-VL在机器人运动空间推理中表现最佳,零样本准确率达71.4%。
Wenxi Wu, Jingjing Zhang, Martim Brandão
CRYSTAL基准评估多模态推理透明性,提出Match F1和Ordered Match F1,揭示现有模型的系统性缺陷。
Wayner Barrios, SouYoung Jin
SldprtNet是一个包含24.2万工业零件的大规模多模态数据集,用于语义驱动的CAD建模。
Ruogu Li, Sikai Li, Yao Mu 等
通过学习先验模型实现零超参数的多角分析,验证成本降低10倍。
Wei W. Xing, Kaiqi Huang, Jiazhan Liu 等
线性化注意力机制中的影响可塑性:非收敛NTK动态的双重影响。
Jose Marie Antonio Miñoza, Paulo Mario P. Medina, Sebastian C. Ibañez
InterEdit通过语义感知计划令牌对齐和交互感知频率令牌对齐,实现多人人体3D动作编辑。
Yebin Yang, Di Wen, Lei Qi 等
DDIM反向链作为分区迭代函数系统,提供去噪扩散模型的统一设计语言。
Ann Dooms
WALAR方法利用单语数据提升低资源语言翻译能力,超越LLaMAX模型。
Yifeng Liu, Siqi Ouyang, Yatish Hosmane Revanasiddappa 等
提出PCA扫掠方法,优化SSD中的维度选择,提升解释性和稳定性。
Hubert Plisiecki, Maria Leniarska, Jan Piotrowski 等
在神经形态硬件上实现联邦少样本学习,使用FedUnion策略保持77.0%准确率。
Steven Motta, Gioele Nanni
OpenSWE通过多代理合成管道创建45,320个可执行Docker环境,提升SWE代理训练效率。
Dayuan Fu, Shenyu Wu, Yunze Wu 等