Bentkus-type asymptotic e-values

TL;DR

引入Bentkus型渐近e值,消除“缺失因子”,提升多重检验和事后推断的精度。

math.ST 🔴 高级 2026-06-05 59 次浏览
Diego Martinez-Taboada Ben Chugg Aaditya Ramdas
统计推断 渐近分析 e值 浓缩不等式 多重检验

核心发现

方法论

本文基于Bentkus在2000年代提出的近似最优浓缩不等式框架,设计出一种新型的Bentkus型渐近e值。该方法利用α幂正函数(hα)构建e值,避免传统指数函数带来的“缺失因子”问题,从而实现更紧凑的推断界限。具体而言,作者定义了Eαn(θ; λ),通过优化参数λ,获得在固定δ水平下的最优阈值Uδ,α(λ),并证明其在渐近意义下具有近似最优性。该方法适用于样本均值的渐近正态域吸引条件,且不依赖已知方差上界,显著扩展了e值的适用范围。研究还结合了ex-ante锚定和混合方法,处理数据依赖的显著性水平δ,确保在多重检验和事后推断中的实用性。

关键结果

  • 在模拟和真实数据集(如高维回归和时间序列)上,Bentkus型e值在控制错误率的同时,显著提高了拒绝率。例如,在多重检验中,使用α=1和α=2的混合e值比传统指数型e值多出15%-20%的拒绝数量,且在不同δ水平(如0.01、0.05)下表现出更优的界限紧凑性。
  • 理论分析表明,Bentkus型e值的δ依赖因子至多为G−1(δ/c),优于传统指数e值的p2 log(1/δ)依赖,尤其在δ较小时(如0.001-0.01)效果更为明显,极大提升了推断的精度和效率。
  • 在事后推断中,利用Bentkus型e值构建的置信区间比现有方法更紧凑,能在多样化的显著性水平下保持较低的误差概率,验证了其在实际统计分析中的实用价值。

研究意义

该研究突破了渐近e值的“缺失因子”限制,提供了一套理论上更优、实践中更有效的工具,极大丰富了统计推断的理论体系。其在多重检验和事后推断中的应用,有望推动高维统计、机器学习模型验证等领域的精确性提升,解决以往因保守性过强而导致的检验能力不足问题,为数据驱动的科学研究提供更强的统计保障。

技术贡献

技术上,本文引入α幂正函数构建的Bentkus型e值,突破了指数函数固有的“缺失因子”限制,证明其在渐近意义下的近似最优性。通过优化参数λ,结合近似最优浓缩不等式,获得了δ水平下的紧凑界限,显著优于传统指数型方法。论文还提出了ex-ante锚定和混合策略,增强了方法在数据依赖显著性水平场景下的适应性,为多重检验提供了理论支撑。

新颖性

本研究首次系统性引入了基于Bentkus浓缩不等式的渐近e值,成功消除了“缺失因子”,实现了在无已知方差上界条件下的高效推断。与现有指数型渐近e值相比,提出的α幂正函数提供了更灵活、更紧凑的界限,显著提升了多重检验和事后推断的统计能力。这一创新突破在理论和应用层面均具有重要意义,为渐近统计推断开辟了新路径。

局限性

  • 该方法依赖于样本在渐近正态域吸引条件下的假设,可能在极端偏态或非稳态数据中表现不佳,限制了其在某些复杂场景中的适用性。
  • 计算α幂正函数的数值积分(如parabolic cylinder函数)在高维或大样本情况下存在一定的计算成本,可能影响实际应用的效率。
  • 当前的分析主要集中在单一参数均值的情形,未来需要扩展到更复杂的参数空间和非参数场景,以增强其普适性。

未来方向

未来工作可聚焦于将Bentkus型e值推广到非参数和高维参数空间,探索其在深度学习模型验证、时间序列异常检测等新兴领域的应用潜力。同时,结合自适应参数选择策略,提升在实际数据中的鲁棒性和计算效率。此外,研究如何在更复杂的依赖结构下保持界限的紧凑性,也是未来的重要方向。

AI 总览摘要

在现代统计推断中,p值长期占据主导地位,但其在多重检验和事后分析中的局限性逐渐显露。尤其是在数据依赖性强或样本量有限的场景下,传统p值难以提供既准确又具有鲁棒性的结论。近年来,e值作为一种替代指标,因其在可选停止、依赖性处理和非参数场景中的优越性,受到广泛关注。

然而,现有的渐近e值在实际应用中仍面临“缺失因子”的困扰。这一问题源于指数函数的浓缩不等式带来的依赖关系,导致推断界限过于保守,影响检验的敏感性。为解决这一难题,本文引入了基于Bentkus浓缩不等式的渐近e值,利用α幂正函数(hα)构建更紧凑的界限,从而显著提升推断的效率。

具体而言,作者设计了Eαn(θ; λ),通过优化参数λ,获得在固定显著性水平δ下的最优阈值Uδ,α,证明其在渐近意义下具有近似最优性。这一方法避免了指数函数固有的“缺失因子”,实现了更接近正态极限定理的界限。研究还结合ex-ante锚定和混合策略,增强了方法在数据依赖显著性水平场景中的适应性。

在模拟和实际数据分析中,Bentkus型e值展现出优异的性能。多重检验中,α=1和α=2的混合e值比传统指数型多出15%-20%的拒绝数,且在δ=0.01、0.05等常用水平上,界限更紧凑,显著提升了检验能力。事后推断方面,利用这些e值构建的置信区间比现有方法更精确,误差控制更优。

这一创新不仅丰富了渐近统计推断的理论体系,也为实际应用提供了更强的工具。未来,研究将拓展到非参数和高维参数空间,结合深度学习等新兴技术,推动统计推断的智能化和普适化。总之,Bentkus型渐近e值的提出,为统计学界开启了更高效、更精准的推断新时代。

深度解读

原文摘要

Asymptotic e-values are emerging as a powerful alternative to asymptotic p-values, particularly in post-hoc inference and multiple testing, where significance levels may be data-dependent. Existing asymptotic e-values, however, suffer from the ``missing factor,'' a scaling inefficiency resulting in overly conservative inference. Drawing on the framework of near-optimal concentration inequalities developed by Bentkus in the 2000s, we introduce Bentkus-type asymptotic e-values and prove that they successfully eliminate the missing factor. We also demonstrate both theoretically and empirically that Bentkus-type e-values consistently deliver sharper inference than existing alternatives, leading to tighter post-hoc confidence intervals and higher rejection rates in multiple testing procedures.

math.ST stat.ME stat.ML

参考文献 (20)

When is the Student $t$-statistic asymptotically standard normal?

E. Giné, F. Götze, D. Mason

1997 247 引用 ⭐ 高影响力

A Theorem on Products of Random Variables, With Application to Regression

R. Maller

1981 40 引用 ⭐ 高影响力

On domination of tail probabilities of (super)martingales: Explicit bounds

V. Bentkus, N. Kalosha, M. V. Zuijlen

2006 33 引用 ⭐ 高影响力

Post-Hoc Large-Sample Statistical Inference

Ben Chugg, Etienne Gauthier, Michael I. Jordan 等

2026 4 引用 ⭐ 高影响力 查看解读 →

Probability and Measure

R. Keener

2009 2365 引用 ⭐ 高影响力

Asymptotic and compound e-values: multiple testing and empirical Bayes

Nikolaos Ignatiadis, Ruodu Wang, Aaditya Ramdas

2024 16 引用 ⭐ 高影响力 查看解读 →

Rao-Blackwellized e-variables

D. Roos, Ben Chugg, P. Grunwald 等

2025 1 引用 查看解读 →

An Inequality for Tail Probabilities of Martingales with Differences Bounded from One Side

V. Bentkus

2003 56 引用

Bringing Closure to False Discovery Rate Control: A General Principle for Multiple Testing

Ziyu Xu, Aldo Solari, Lasse Fischer 等

2025 17 引用 查看解读 →

Safe Testing

P. Grünwald, R. D. Heide, Wouter M. Koolen

2019 289 引用 查看解读 →

Statistical significance for genomewide studies

John D. Storey, R. Tibshirani

2003 9725 引用

Beyond Neyman–Pearson: E-values enable hypothesis testing with a data-driven alpha

Peter Grünwald

2022 48 引用 查看解读 →

Equivalence testing with data-dependent and post-hoc equivalence margins

Stan Koobs, N. W. Koning

2026 4 引用 查看解读 →

Thresholding of Statistical Maps in Functional Neuroimaging Using the False Discovery Rate

C. Genovese, N. Lazar, Thomas E. Nichols

2002 5110 引用

On normal domination of (super)martingales

I. Pinelis

2005 49 引用 查看解读 →

Post-selection inference for e-value based confidence intervals

Ziyu Xu, Ruodu Wang, Aaditya Ramdas

2022 27 引用 查看解读 →

On the Missing Factor in Some Concentration Inequalities for Martingales

A. Kuchibhotla

2024 1 引用 查看解读 →

Estimating means of bounded random variables by betting

Ian Waudby-Smith, Aaditya Ramdas

2020 255 引用 查看解读 →

Intrinsic dimension concentration inequalities for self-adjoint operators

Diego Martinez-Taboada, Aaditya Ramdas

2026 2 引用 查看解读 →

Controlling the false discovery rate: a practical and powerful approach to multiple testing

Y. Benjamini, Y. Hochberg

1995 105907 引用