Paper Insights - AI Arxiv Paper Analysis

Sort: Latest Popular Citations

All Artificial Intelligence Computation and Language Computer Vision Information Retrieval Machine Learning Machine Learning (Stats) Neural and Evolutionary Computing Robotics

cs.LG 2603.12163

A Quantitative Characterization of Forgetting in Post-Training

Quantifies forgetting in generative models post-training using forward and reverse KL objectives, avoiding quality degradation.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan

2026-03-13 47

cs.LG 2603.11909

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

EnTransformer combines Transformer with engression for superior multivariate probabilistic forecasting.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja et al.

2026-03-12 46

cs.LG 2603.11045

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

NeFTY achieves high-accuracy 3D thermal diffusion reconstruction using a differentiable physics framework, significantly improving defect localization.

Tao Zhong, Yixun Hu, Dongzhe Zheng et al.

2026-03-12 60

cs.LG 2603.11021

Leech Lattice Vector Quantization for Efficient LLM Compression

Leech Lattice Vector Quantization (LLVQ) achieves efficient LLM compression, outperforming Quip# and QTIP.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough et al.

2026-03-12 227

cs.LG 2603.11000

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Using cross-species transfer learning to enhance electrophysiology-to-transcriptomics mapping accuracy in cortical GABAergic interneurons.

Theo Schwider, Ramin Ramezani

2026-03-12 45

cs.LG 2603.10985

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

MLP layers in Transformers perform binary routing; validated in GPT-2, removing MLP increases perplexity by 43.3%.

Peter Balogh

2026-03-12 47