CS3: Efficient Online Capability Synergy for Two-Tower Recommendation
CS3框架通过循环自适应结构、跨塔同步和级联模型共享,实现了两塔推荐系统的高效在线能力协同,提升了8.36%的广告收入。
Lixiang Wang, Shaoyun Shi, Peng Wang 等
CS3框架通过循环自适应结构、跨塔同步和级联模型共享,实现了两塔推荐系统的高效在线能力协同,提升了8.36%的广告收入。
Lixiang Wang, Shaoyun Shi, Peng Wang 等
通过居中和奇异值阈值法快速估计高斯混合模型的成分数,无需迭代。
Huan Qing
S2MAM通过双层优化实现鲁棒估计和变量选择,验证于16个数据集。
Xuelin Zhang, Hong Chen, Yingjie Wang 等
MathNet提供了一个全球多模态数学推理和检索基准,涵盖47国的30,676道奥数题。
Shaden Alshammari, Kevin Wen, Abrar Zainal 等
MUA方法通过小波引导的多层空间因子化混合形状,实现高达2000倍的计算成本降低。
Heming Zhu, Guoxing Sun, Marc Habermann
Sessa通过在反馈路径中引入选择性注意机制,实现长程记忆增强。
Liubomyr Horbatko
提出了有界比率强化学习(BRRL)框架,实验表明在MuJoCo等环境中性能优于PPO。
Yunke Ao, Le Chen, Bruce D. Lee 等
BLF系统通过序列贝叶斯更新语言信念,在ForecastBench基准上实现了最先进的二元预测性能。
Kevin Murphy
Apollo模型整合28种医学模态和12个专业领域的临床记录,预测新疾病风险达5年。
Andrew Zhang, Tong Ding, Sophia J. Wagner 等
重新审视主动顺序预测驱动的均值估计,发现最小置信区间宽度在常数概率权重接近1时出现。
Maria-Eleni Sfyraki, Jun-Kun Wang
研究揭示语言模型内部层与人类句子处理的双重对齐,早期层适合自然阅读,后期层更好模拟复杂句法处理。
Tatsuki Kuribayashi, Alex Warstadt, Yohei Oseki 等
ConforNets通过通道仿射变换控制AF3潜在表示,提升多态预测成功率。
Minji Lee, Colin Kalicki, Minkyu Jeon 等
SynAgent通过单体到协作代理协同,实现通用化的人形协作操控,显著提升多种物体几何的泛化能力。
Wei Yao, Haohan Ma, Hongwen Zhang 等
GSQ通过Gumbel-Softmax采样实现高精度低比特量化,缩小了标量量化与QTIP方法的精度差距。
Alireza Dadgarnia, Soroush Tabesh, Mahdi Nikdan 等
ClawEnvKit自动生成爪状代理环境,降低成本13800倍。
Xirui Li, Ming Li, Derry Xu 等
使用转移矩阵正则化提高咨询对话中下一个对话行为预测的准确性,提升宏F1分数9-42%。
Eric Rudolph, Philipp Steigerwald, Jens Albrecht
MetaCloak-JPEG通过可微JPEG层提高对DreamBooth深度伪造的JPEG鲁棒性,PSNR达32.7 dB。
Tanjim Rahaman Fardin, S M Zunaid Alam, Mahadi Hasan Fahim 等
通过RLVR、SFT和拒绝特征消除三种路径研究LLM越狱的行为和机制差异,发现RLVR越狱模型与基础模型相似。
Md Rysul Kabir, Zoran Tiganj
文档作为图像的表示在科学检索中表现不佳,文本+图像交错表示更有效。
Ghazal Khalighinejad, Raghuveer Thirukovalluru, Alexander H. Oh 等
OneVL通过视觉-语言解释实现一步潜在推理和规划,超越显式CoT,达到答案级延迟。
Jinghui Lu, Jiayi Guan, Zhijian Huang 等