Paper Insights - AI Arxiv Paper Analysis

cs.LG 2603.13186

Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights

Using CWRF, only critical weights are adjusted to enhance privacy while maintaining utility.

Xingli Fang, Jung-Eun Kim

2026-03-14 1 citations 135

cs.LG 2603.13180

MXNorm: Reusing MXFP block scales for efficient tensor normalisation

MXNorm reuses MXFP8 block scales for efficient tensor normalization, reducing reduction size by 32x.

Callum McLean, Luke Y. Prince, Alexandre Payot et al.

2026-03-14 114

cs.LG 2603.13115

ZO-SAM: Zero-Order Sharpness-Aware Minimization for Efficient Sparse Training

ZO-SAM integrates zero-order optimization to reduce computational costs, enhancing efficiency and robustness in sparse training.

Jie Ji, Gen Li, Kaiyuan Deng et al.

2026-03-14 93

cs.LG 2603.13109

BoSS: A Best-of-Strategies Selector as an Oracle for Deep Active Learning

BoSS enhances deep active learning performance by integrating multiple selection strategies, excelling on large-scale datasets.

Denis Huseljic, Paul Hahn, Marek Herde et al.

2026-03-14 100

cs.LG 2603.13092

Breaking the Tuning Barrier: Zero-Hyperparameters Yield Multi-Corner Analysis Via Learned Priors

Zero-hyperparameter multi-corner analysis using learned priors reduces validation cost by over 10 times.

Wei W. Xing, Kaiqi Huang, Jiazhan Liu et al.

2026-03-13 104

cs.LG 2603.13085

Influence Malleability in Linearized Attention: Dual Implications of Non-Convergent NTK Dynamics

Influence Malleability in Linearized Attention: Dual Implications of Non-Convergent NTK Dynamics.

Jose Marie Antonio Miñoza, Paulo Mario P. Medina, Sebastian C. Ibañez

2026-03-13 133

cs.LG 2603.13069

Fractals made Practical: Denoising Diffusion as Partitioned Iterated Function Systems

DDIM reverse chain as Partitioned Iterated Function Systems provides a unified design language for denoising diffusion models.

Ann Dooms

2026-03-13 90

cs.LG 2603.12261

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Achieve color control in FLUX's VAE latent space, revealing a structure reflecting Hue, Saturation, and Lightness.

Mateusz Pach, Jessica Bader, Quentin Bouniot et al.

2026-03-13 155

cs.LG 2603.12244

Separable neural architectures as a primitive for unified predictive and generative intelligence

Separable Neural Architectures (SNA) unify predictive and generative intelligence by constraining interaction order and tensor rank.

Reza T. Batley, Apurba Sarker, Rajib Mostakim et al.

2026-03-13 95

cs.LG 2603.12237

STAMP: Selective Task-Aware Mechanism for Text Privacy

STAMP framework uses the Polar mechanism to achieve superior privacy-utility trade-offs in text privacy.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson et al.

2026-03-13 127

cs.LG 2603.12231

Temporal Straightening for Latent Planning

Temporal Straightening improves latent planning success rates by 20-60% using curvature regularization.

Ying Wang, Oumayma Bounou, Gaoyue Zhou et al.

2026-03-13 140

cs.LG 2603.12228

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

RandOpt enhances large-scale models via random perturbations and ensemble voting around pretrained weights.

Yulu Gan, Phillip Isola

2026-03-13 7 citations 270

cs.LG 2603.12163

A Quantitative Characterization of Forgetting in Post-Training

Quantifies forgetting in generative models post-training using forward and reverse KL objectives, avoiding quality degradation.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan

2026-03-13 118

cs.LG 2603.11909

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

EnTransformer combines Transformer with engression for superior multivariate probabilistic forecasting.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja et al.

2026-03-12 99

cs.LG 2603.11045

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

NeFTY achieves high-accuracy 3D thermal diffusion reconstruction using a differentiable physics framework, significantly improving defect localization.

Tao Zhong, Yixun Hu, Dongzhe Zheng et al.

2026-03-12 1 citations 149

cs.LG 2603.11021

Leech Lattice Vector Quantization for Efficient LLM Compression

Leech Lattice Vector Quantization (LLVQ) achieves efficient LLM compression, outperforming Quip# and QTIP.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough et al.

2026-03-12 463

cs.LG 2603.11000

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Using cross-species transfer learning to enhance electrophysiology-to-transcriptomics mapping accuracy in cortical GABAergic interneurons.

Theo Schwider, Ramin Ramezani

2026-03-12 107

cs.LG 2603.10985

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

MLP layers in Transformers perform binary routing; validated in GPT-2, removing MLP increases perplexity by 43.3%.

Peter Balogh

2026-03-12 123