Sessa: Selective State Space Attention
Sessa通过在反馈路径中引入选择性注意机制,实现长程记忆增强。
Liubomyr Horbatko
Sessa通过在反馈路径中引入选择性注意机制,实现长程记忆增强。
Liubomyr Horbatko
提出了有界比率强化学习(BRRL)框架,实验表明在MuJoCo等环境中性能优于PPO。
Yunke Ao, Le Chen, Bruce D. Lee 等
BLF系统通过序列贝叶斯更新语言信念,在ForecastBench基准上实现了最先进的二元预测性能。
Kevin Murphy
Apollo模型整合28种医学模态和12个专业领域的临床记录,预测新疾病风险达5年。
Andrew Zhang, Tong Ding, Sophia J. Wagner 等
重新审视主动顺序预测驱动的均值估计,发现最小置信区间宽度在常数概率权重接近1时出现。
Maria-Eleni Sfyraki, Jun-Kun Wang
研究揭示语言模型内部层与人类句子处理的双重对齐,早期层适合自然阅读,后期层更好模拟复杂句法处理。
Tatsuki Kuribayashi, Alex Warstadt, Yohei Oseki 等
ConforNets通过通道仿射变换控制AF3潜在表示,提升多态预测成功率。
Minji Lee, Colin Kalicki, Minkyu Jeon 等
SynAgent通过单体到协作代理协同,实现通用化的人形协作操控,显著提升多种物体几何的泛化能力。
Wei Yao, Haohan Ma, Hongwen Zhang 等
GSQ通过Gumbel-Softmax采样实现高精度低比特量化,缩小了标量量化与QTIP方法的精度差距。
Alireza Dadgarnia, Soroush Tabesh, Mahdi Nikdan 等
ClawEnvKit自动生成爪状代理环境,降低成本13800倍。
Xirui Li, Ming Li, Derry Xu 等
使用转移矩阵正则化提高咨询对话中下一个对话行为预测的准确性,提升宏F1分数9-42%。
Eric Rudolph, Philipp Steigerwald, Jens Albrecht
MetaCloak-JPEG通过可微JPEG层提高对DreamBooth深度伪造的JPEG鲁棒性,PSNR达32.7 dB。
Tanjim Rahaman Fardin, S M Zunaid Alam, Mahadi Hasan Fahim 等
通过RLVR、SFT和拒绝特征消除三种路径研究LLM越狱的行为和机制差异,发现RLVR越狱模型与基础模型相似。
Md Rysul Kabir, Zoran Tiganj
文档作为图像的表示在科学检索中表现不佳,文本+图像交错表示更有效。
Ghazal Khalighinejad, Raghuveer Thirukovalluru, Alexander H. Oh 等
OneVL通过视觉-语言解释实现一步潜在推理和规划,超越显式CoT,达到答案级延迟。
Jinghui Lu, Jiayi Guan, Zhijian Huang 等
XEmbodied模型通过3D适配器和高效图像-实体适配器增强几何和物理线索,提升VLA模型性能。
Kangan Qian, ChuChu Xie, Yang Zhong 等
ACoFi方法结合学习的安全过滤器与自适应保序推断,提升控制系统安全性。
Sacha Huriot, Ihab Tabbara, Hussein Sibai
提出了一种基于半质量半径的稳健保形预测方法,适用于重尾分布。
Alejandro Cholaquidis, Emilien Joly, Leonardo Moreno
提出了用于平滑图函数的谱Bandit算法,在有效维度上实现线性和次线性扩展。
Michal Valko, Rémi Munos, Branislav Kveton 等
自适应核选择提升核化扩散映射的稳定性和精度。
Othmane Aboussaad, Adam Miraoui, Boumediene Hamzi 等