Paper 解读 - Arxiv 论文中文解读平台

cs.IR 2604.19269

CS3: Efficient Online Capability Synergy for Two-Tower Recommendation

CS3框架通过循环自适应结构、跨塔同步和级联模型共享，实现了两塔推荐系统的高效在线能力协同，提升了8.36%的广告收入。

Lixiang Wang, Shaoyun Shi, Peng Wang 等

2026-04-21 160

stat.ML 2604.19091

Fast estimation of Gaussian mixture components via centering and singular value thresholding

通过居中和奇异值阈值法快速估计高斯混合模型的成分数，无需迭代。

Huan Qing

2026-04-21 77

cs.LG 2604.19072

S2MAM: Semi-supervised Meta Additive Model for Robust Estimation and Variable Selection

S2MAM通过双层优化实现鲁棒估计和变量选择，验证于16个数据集。

Xuelin Zhang, Hong Chen, Yingjie Wang 等

2026-04-21 90

cs.AI 2604.18584

MathNet: a Global Multimodal Benchmark for Mathematical Reasoning and Retrieval

MathNet提供了一个全球多模态数学推理和检索基准，涵盖47国的30,676道奥数题。

Shaden Alshammari, Kevin Wen, Abrar Zainal 等

2026-04-21 1 引用 88

cs.CV 2604.18583

MUA: Mobile Ultra-detailed Animatable Avatars

MUA方法通过小波引导的多层空间因子化混合形状，实现高达2000倍的计算成本降低。

Heming Zhu, Guoxing Sun, Marc Habermann

2026-04-21 97

cs.LG 2604.18580

Sessa: Selective State Space Attention

Sessa通过在反馈路径中引入选择性注意机制，实现长程记忆增强。

Liubomyr Horbatko

2026-04-21 83

cs.LG 2604.18578

Bounded Ratio Reinforcement Learning

提出了有界比率强化学习（BRRL）框架，实验表明在MuJoCo等环境中性能优于PPO。

Yunke Ao, Le Chen, Bruce D. Lee 等

2026-04-21 114

cs.AI 2604.18576

Agentic Forecasting using Sequential Bayesian Updating of Linguistic Beliefs

BLF系统通过序列贝叶斯更新语言信念，在ForecastBench基准上实现了最先进的二元预测性能。

Kevin Murphy

2026-04-21 193

cs.LG 2604.18570

A multimodal and temporal foundation model for virtual patient representations at healthcare system scale

Apollo模型整合28种医学模态和12个专业领域的临床记录，预测新疾病风险达5年。

Andrew Zhang, Tong Ding, Sophia J. Wagner 等

2026-04-21 324

stat.ML 2604.18569

Revisiting Active Sequential Prediction-Powered Mean Estimation

重新审视主动顺序预测驱动的均值估计，发现最小置信区间宽度在常数概率权重接近1时出现。

Maria-Eleni Sfyraki, Jun-Kun Wang

2026-04-21 86

cs.CL 2604.18563

Dual Alignment Between Language Model Layers and Human Sentence Processing

研究揭示语言模型内部层与人类句子处理的双重对齐，早期层适合自然阅读，后期层更好模拟复杂句法处理。

Tatsuki Kuribayashi, Alex Warstadt, Yohei Oseki 等

2026-04-21 103

q-bio.BM 2604.18559

ConforNets: Latents-Based Conformational Control in OpenFold3

ConforNets通过通道仿射变换控制AF3潜在表示，提升多态预测成功率。

Minji Lee, Colin Kalicki, Minkyu Jeon 等

2026-04-21 110

cs.CV 2604.18557

SynAgent: Generalizable Cooperative Humanoid Manipulation via Solo-to-Cooperative Agent Synergy

SynAgent通过单体到协作代理协同，实现通用化的人形协作操控，显著提升多种物体几何的泛化能力。

Wei Yao, Haohan Ma, Hongwen Zhang 等

2026-04-21 104

cs.CL 2604.18556

GSQ: Highly-Accurate Low-Precision Scalar Quantization for LLMs via Gumbel-Softmax Sampling

GSQ通过Gumbel-Softmax采样实现高精度低比特量化，缩小了标量量化与QTIP方法的精度差距。

Alireza Dadgarnia, Soroush Tabesh, Mahdi Nikdan 等

2026-04-21 133

cs.AI 2604.18543

ClawEnvKit: Automatic Environment Generation for Claw-Like Agents

ClawEnvKit自动生成爪状代理环境，降低成本13800倍。

Xirui Li, Ming Li, Derry Xu 等

2026-04-21 94

cs.CL 2604.18539

Transition-Matrix Regularization for Next Dialogue Act Prediction in Counselling Conversations

使用转移矩阵正则化提高咨询对话中下一个对话行为预测的准确性，提升宏F1分数9-42%。

Eric Rudolph, Philipp Steigerwald, Jens Albrecht

2026-04-21 81

cs.CV 2604.18537

MetaCloak-JPEG: JPEG-Robust Adversarial Perturbation for Preventing Unauthorized DreamBooth-Based Deepfake Generation

MetaCloak-JPEG通过可微JPEG层提高对DreamBooth深度伪造的JPEG鲁棒性，PSNR达32.7 dB。

Tanjim Rahaman Fardin, S M Zunaid Alam, Mahadi Hasan Fahim 等

2026-04-21 143

cs.CR 2604.18510

Different Paths to Harmful Compliance: Behavioral Side Effects and Mechanistic Divergence Across LLM Jailbreaks

通过RLVR、SFT和拒绝特征消除三种路径研究LLM越狱的行为和机制差异，发现RLVR越狱模型与基础模型相似。

Md Rysul Kabir, Zoran Tiganj

2026-04-21 107

cs.IR 2604.18508

Document-as-Image Representations Fall Short for Scientific Retrieval

文档作为图像的表示在科学检索中表现不佳，文本+图像交错表示更有效。

Ghazal Khalighinejad, Raghuveer Thirukovalluru, Alexander H. Oh 等

2026-04-21 177

cs.CV 2604.18486

OneVL: One-Step Latent Reasoning and Planning with Vision-Language Explanation

OneVL通过视觉-语言解释实现一步潜在推理和规划，超越显式CoT，达到答案级延迟。

Jinghui Lu, Jiayi Guan, Zhijian Huang 等

2026-04-21 94