Paper 解读 - Arxiv 论文中文解读平台

排序: 最新热门引用

全部 Artificial Intelligence Computation and Language Computer Vision Information Retrieval Machine Learning Machine Learning (Stats) Neural and Evolutionary Computing Robotics

cs.LG 2603.12163

A Quantitative Characterization of Forgetting in Post-Training

通过正反向KL目标量化生成模型训练后遗忘，避免质量下降。

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan

2026-03-13 47

cs.LG 2603.11909

EnTransformer结合Transformer与engression，实现多变量概率预测，优于现有模型。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja 等

2026-03-12 46

cs.LG 2603.11045

NeFTY通过可微物理框架实现高精度3D热扩散重建，显著提高缺陷定位准确性。

Tao Zhong, Yixun Hu, Dongzhe Zheng 等

2026-03-12 60

cs.LG 2603.11021

Leech Lattice Vector Quantization (LLVQ) 提供高效的LLM压缩，优于Quip#和QTIP。

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough 等

2026-03-12 227

cs.LG 2603.11000

利用跨物种迁移学习，提升皮层GABA能中间神经元的电生理到转录组映射精度。

Theo Schwider, Ramin Ramezani

2026-03-12 45

cs.LG 2603.10985

MLP层在Transformer中执行二进制路由，GPT-2中验证其有效性，减少MLP层提升困惑度43.3%。

Peter Balogh

2026-03-12 47