Pliable rejection sampling

TL;DR

可塑拒绝采样（PRS）通过核估计学习采样提议，保证高概率独立同分布采样。

stat.ML 🔴 高级 2026-04-24 6 引用 18 次浏览

Akram Erraqabi Michal Valko Alexandra Carpentier Odalric-Ambrym Maillard

AI 阅读器 Arxiv 原文下载 PDF

拒绝采样核估计自适应采样机器学习概率分布

核心发现

方法论

本研究提出了一种新的拒绝采样方法——可塑拒绝采样（PRS），通过核估计学习采样提议分布。该方法利用核估计构建一个提议分布，该分布是目标密度的上界，从而提高采样效率。PRS方法在保证采样独立同分布的同时，提供了关于接受样本数量的理论保证。

关键结果

结果1：在实验中，PRS方法在高维数据集上的接受率显著提高，达到了66.4%的接受率，相较于传统方法的25.0%，提高了41.4%。
结果2：在低维情况下，PRS的接受率达到了79.5%，而A⋆采样为89.4%，显示出与最先进方法相当的性能。
结果3：在拥挤问题的实验中，PRS在一维和二维情况下的接受率分别为79.5%和51.0%，显示出其在处理复杂分布时的有效性。

研究意义

该研究在学术界和工业界具有重要意义。通过提高拒绝采样的接受率，PRS方法能够在更广泛的应用场景中实现高效的概率分布采样。这对于需要从复杂分布中采样的机器学习和统计建模任务尤为重要，解决了传统方法中高拒绝率导致的资源浪费问题。

技术贡献

技术贡献包括：1) 提出了基于核估计的可塑拒绝采样方法，突破了传统自适应拒绝采样对分布形状的严格假设；2) 提供了关于样本接受率的理论保证，填补了现有方法在性能保证方面的空白；3) 通过结合核密度估计与传统拒绝采样，简化了实现过程。

新颖性

PRS方法的创新之处在于其利用核估计来学习提议分布，这在拒绝采样领域是首次。与现有方法相比，PRS不再依赖于分布的特定形状假设，适用于更广泛的密度类别。

局限性

局限1：对于高维数据，尽管PRS方法有所改进，但仍面临计算成本高的问题，尤其是在样本空间维度较大时。
局限2：在处理极端尖峰分布时，PRS的性能可能会下降，因为这些分布的估计难度较大。
局限3：该方法在非归一化分布上的表现尚需进一步验证。

未来方向

未来研究方向包括：1) 进一步优化PRS方法在高维情况下的计算效率；2) 探索PRS在非归一化分布上的应用；3) 将PRS与其他采样技术结合，开发更具鲁棒性的混合采样方法。

AI 总览摘要

在机器学习和统计建模中，采样是一个关键步骤，尤其是当我们需要从复杂的概率分布中获取样本时。传统的拒绝采样方法因其高拒绝率而受到限制，这导致了资源的浪费和效率的低下。现有的自适应拒绝采样方法虽然有所改进，但通常仅适用于特定分布，且缺乏性能保证。

本研究提出了一种新的拒绝采样方法——可塑拒绝采样（PRS），通过核估计学习采样提议分布。该方法的核心在于利用核估计构建一个提议分布，该分布是目标密度的上界，从而提高采样效率。与传统方法不同，PRS在保证采样独立同分布的同时，提供了关于接受样本数量的理论保证。

在技术上，PRS方法结合了核密度估计与传统拒绝采样，简化了实现过程，并突破了传统方法对分布形状的严格假设。实验结果显示，PRS在高维数据集上的接受率显著提高，达到了66.4%的接受率，相较于传统方法的25.0%，提高了41.4%。在低维情况下，PRS的接受率达到了79.5%，显示出与最先进方法相当的性能。

然而，PRS方法也存在一些局限性。例如，对于高维数据，尽管PRS方法有所改进，但仍面临计算成本高的问题，尤其是在样本空间维度较大时。此外，在处理极端尖峰分布时，PRS的性能可能会下降，因为这些分布的估计难度较大。未来的研究方向包括进一步优化PRS方法在高维情况下的计算效率，并探索其在非归一化分布上的应用。

深度分析

研究背景

拒绝采样是一种用于从复杂分布中获取样本的技术。传统的拒绝采样方法通过构建一个包络分布来实现采样，但由于高拒绝率，其应用受到限制。自适应拒绝采样方法通过利用分布的特定性质来提高接受率，但通常仅适用于特定分布，且缺乏性能保证。近年来，随着机器学习和统计建模的快速发展，如何高效地从复杂分布中采样成为一个重要的研究课题。

核心问题

核心问题在于如何在不依赖于分布特定形状假设的情况下，提高拒绝采样的接受率。传统方法的高拒绝率导致了计算资源的浪费，而现有自适应方法的局限性在于其适用范围有限，无法提供普适的性能保证。因此，开发一种能够在更广泛的分布类别中实现高效采样的方法具有重要意义。

核心创新

本研究的核心创新在于：1) 提出了基于核估计的可塑拒绝采样方法，突破了传统自适应拒绝采样对分布形状的严格假设；2) 提供了关于样本接受率的理论保证，填补了现有方法在性能保证方面的空白；3) 通过结合核密度估计与传统拒绝采样，简化了实现过程。

方法详解

�� 使用核估计构建提议分布：通过核估计方法，构建一个目标密度的上界作为提议分布。

�� 进行拒绝采样：利用构建的提议分布进行拒绝采样，确保采样的独立同分布性。

�� 提供接受率保证：通过理论分析，提供关于接受样本数量的保证，确保采样效率。

实验设计

实验设计包括在不同维度的数据集上测试PRS方法的性能。使用的基准包括传统的简单拒绝采样（SRS）和A⋆采样方法。评估指标为接受率和计算效率。实验还涉及不同分布形状的测试，以验证PRS方法的普适性。

结果分析

实验结果显示，PRS方法在高维数据集上的接受率显著提高，达到了66.4%的接受率，相较于传统方法的25.0%，提高了41.4%。在低维情况下，PRS的接受率达到了79.5%，显示出与最先进方法相当的性能。此外，在处理复杂分布时，PRS方法表现出色，能够有效地提高采样效率。

应用场景

PRS方法可以直接应用于需要从复杂分布中采样的机器学习和统计建模任务，如贝叶斯推断和蒙特卡罗方法。其高效的采样能力能够显著减少计算资源的浪费，提高模型训练和推断的效率。

局限与展望

尽管PRS方法在提高采样效率方面表现出色，但在高维数据集上的计算成本仍然较高。此外，在处理极端尖峰分布时，PRS的性能可能会下降。未来的研究可以探索如何进一步优化PRS方法的计算效率，并扩展其在非归一化分布上的应用。

通俗解读非专业人士也能看懂

想象你在一个大型超市购物，超市里有成千上万种商品，而你只想买几样特定的东西。传统的购物方式就像是拒绝采样，你需要在超市里走来走去，找到你想要的商品，但可能会浪费很多时间在不需要的商品上。可塑拒绝采样就像是有一个智能购物助手，它能根据你的购物清单和超市的布局，快速找到你需要的商品，并且只需要很少的时间和精力。这种方法通过学习超市的布局和商品分布，优化了购物路线，减少了不必要的时间浪费。对于复杂的商品分布（比如某些商品在超市的某个角落），这种方法尤其有效，因为它能快速适应不同的布局变化。

简单解释像给14岁少年讲一样

嘿，小伙伴们！想象一下你在玩一个游戏，你需要从一堆混乱的卡片中找到特定的几张。传统的方法就像是随机翻开卡片，希望能找到你想要的，但这可能需要翻很多次，浪费时间。现在，有一种新的方法叫做可塑拒绝采样，它就像是一个超级聪明的助手，能帮你快速找到你想要的卡片！它通过学习卡片的分布规律，优化了翻卡片的顺序，让你更快地找到目标卡片。是不是很酷？这就像是游戏中的一个超级技能，能让你在最短的时间内完成任务！

术语表

拒绝采样 (Rejection Sampling)

一种从复杂分布中采样的技术，通过构建一个包络分布来实现采样，但由于高拒绝率，其应用受到限制。

在本文中，拒绝采样是基础方法，PRS在此基础上进行改进。

核估计 (Kernel Estimation)

一种非参数统计方法，用于估计概率密度函数。通过核函数对数据进行平滑处理，得到密度估计。

PRS方法利用核估计来构建提议分布。

自适应拒绝采样 (Adaptive Rejection Sampling)

一种改进的拒绝采样方法，通过利用分布的特定性质来提高接受率，但通常仅适用于特定分布。

本文中提到的自适应拒绝采样方法的局限性是PRS方法的研究背景。

独立同分布 (i.i.d.)

指样本之间相互独立且服从相同的概率分布，是统计学中的一个基本假设。

PRS方法保证采样的独立同分布性。

贝叶斯推断 (Bayesian Inference)

一种统计推断方法，通过贝叶斯定理更新概率分布，以反映新的证据。

PRS方法可以应用于贝叶斯推断任务中。

蒙特卡罗方法 (Monte Carlo Method)

一种通过随机采样进行数值计算的方法，广泛用于物理、金融和统计等领域。

PRS方法在蒙特卡罗方法中可以提高采样效率。

包络分布 (Envelope Distribution)

在拒绝采样中，包络分布是一个用于包络目标分布的分布，用于决定样本是否被接受。

PRS方法通过核估计构建一个目标密度的上界作为包络分布。

尖峰分布 (Peaky Distribution)

指概率密度函数在某些区域呈现极高值的分布，通常难以估计。

在处理尖峰分布时，PRS方法的性能可能会下降。

非归一化分布 (Non-normalized Distribution)

指积分不为1的概率分布，通常需要归一化处理。

PRS方法在非归一化分布上的表现尚需进一步验证。

高维数据 (High-dimensional Data)

指特征空间维度较高的数据集，通常计算复杂度较高。

PRS方法在高维数据集上的计算成本仍然较高。

开放问题这项研究留下的未解疑问

1 如何进一步提高PRS方法在高维数据集上的计算效率？尽管PRS方法在提高采样效率方面表现出色，但在高维数据集上的计算成本仍然较高。现有方法在处理高维数据时，通常面临计算复杂度和内存消耗的问题。
2 如何扩展PRS方法在非归一化分布上的应用？非归一化分布在实际应用中较为常见，尤其是在贝叶斯推断中。然而，PRS方法在非归一化分布上的表现尚需进一步验证。
3 如何处理极端尖峰分布的采样问题？尖峰分布由于其极高的密度值，通常难以估计和采样。PRS方法在处理此类分布时，性能可能会下降。
4 如何将PRS方法与其他采样技术结合，开发更具鲁棒性的混合采样方法？现有的采样方法各有优缺点，结合不同方法的优势可能会带来更好的性能。
5 如何在不增加计算成本的情况下，进一步提高PRS方法的接受率？接受率是采样效率的关键指标，如何在保证计算效率的同时提高接受率是一个重要的研究方向。

应用场景

近期应用

贝叶斯推断

PRS方法可以应用于贝叶斯推断任务中，通过提高采样效率，减少计算资源的浪费，提高模型训练和推断的效率。

蒙特卡罗方法

在蒙特卡罗方法中，PRS方法可以显著提高采样效率，尤其是在处理复杂分布时，能够减少计算时间和资源消耗。

统计建模

PRS方法可以用于统计建模中的概率分布采样，提高模型的准确性和效率，适用于需要从复杂分布中采样的任务。

远期愿景

高维数据处理

随着数据维度的增加，PRS方法在高维数据处理中的应用前景广阔。通过进一步优化计算效率，PRS方法有望在大数据分析中发挥重要作用。

非归一化分布应用

在非归一化分布的应用中，PRS方法可以提供更高效的采样方案，尤其是在贝叶斯推断和复杂统计模型中，具有广泛的应用潜力。

原文摘要

Rejection sampling is a technique for sampling from difficult distributions. However, its use is limited due to a high rejection rate. Common adaptive rejection sampling methods either work only for very specific distributions or without performance guarantees. In this paper, we present pliable rejection sampling (PRS), a new approach to rejection sampling, where we learn the sampling proposal using a kernel estimator. Since our method builds on rejection sampling, the samples obtained are with high probability i.i.d. and distributed according to f. Moreover, PRS comes with a guarantee on the number of accepted samples.

stat.ML cs.LG

参考文献 (20)

A* Sampling

Chris J. Maddison, Daniel Tarlow, T. Minka

2014 431 引用 ⭐ 高影响力查看解读 →

Introductory Lectures on Convex Optimization - A Basic Course

Y. Nesterov

2014 6403 引用 ⭐ 高影响力

Neural Information Processing Systems

1997 447 引用 ⭐ 高影响力

An Introduction to MCMC for Machine Learning

C. Andrieu, Nando de Freitas, A. Doucet 等

2004 2749 引用 ⭐ 高影响力

Adaptive Rejection Sampling for Gibbs Sampling

By W. R. GILKSt

2010 746 引用 ⭐ 高影响力

Coupling from the past: A user's guide

J. Propp, David Wilson

1997 89 引用

The entropic barrier: a simple and optimal universal self-concordant barrier

Sébastien Bubeck, Ronen Eldan

2014 69 引用查看解读 →

The Monte-Carlo Method

P. Atzberger

2006 3204 引用

Adaptive Rejection Metropolis Sampling Within Gibbs Sampling

W. Gilks, N. Best, K. Tan

1995 765 引用

Nonparametric Importance Sampling

Ping Zhang

1996 131 引用

An interruptible algorithm for perfect sampling via Markov chains

J. A. Fill

1997 243 引用

Pointwise and sup-norm sharp adaptive estimation of functions on the Sobolev classes

A. Tsybakov

1998 123 引用

The asymptotic minimax constant for sup-norm loss in nonparametric density estimation

A. Korostelev, M. Nussbaum

1999 34 引用

Expectation Propagation for approximate Bayesian inference

T. Minka

2001 1972 引用查看解读 →

Adaptive estimation of a distribution function and its density in sup-norm loss by wavelet and spline projections

Evarist Gin'e, Richard Nickl

2008 32 引用查看解读 →

CONFIDENCE BANDS IN DENSITY ESTIMATION

Evarist Gin'e, Richard Nickl

2010 183 引用查看解读 →

A generalization of the adaptive rejection sampling algorithm

Luca Martino, J. Míguez

2010 41 引用

Concave-Convex Adaptive Rejection Sampling

Dilan Görür, Y. Teh

2011 45 引用

The OS* Algorithm: a Joint Approach to Exact Optimization and Sampling

Marc Dymetman, Guillaume Bouchard, Simon Carter

2012 13 引用查看解读 →

Canonical Barriers on Convex Cones

R. Hildebrand

2014 28 引用

被引用 (6)

An Easy Rejection Sampling Baseline via Gradient Refined Proposals

2023 ⭐ 高影响力查看解读 →

A minimax near-optimal algorithm for adaptive rejection sampling

2018 5 引用 ⭐ 高影响力查看解读 →

Direct sampling with a step function

2022 1 引用查看解读 →

Exact sampling of determinantal point processes with sublinear time preprocessing

2019 58 引用查看解读 →

Efficiency of adaptive importance sampling

2018 2 引用

Asymptotic optimality of adaptive importance sampling

2018 35 引用查看解读 →

Pliable rejection sampling

核心发现

方法论

关键结果

研究意义

技术贡献

新颖性

局限性

未来方向

AI 总览摘要

深度分析

研究背景

核心问题

核心创新

方法详解

实验设计

结果分析

应用场景

局限与展望

通俗解读 非专业人士也能看懂

简单解释 像给14岁少年讲一样

术语表

拒绝采样 (Rejection Sampling)

核估计 (Kernel Estimation)

自适应拒绝采样 (Adaptive Rejection Sampling)

独立同分布 (i.i.d.)

贝叶斯推断 (Bayesian Inference)

蒙特卡罗方法 (Monte Carlo Method)

包络分布 (Envelope Distribution)

尖峰分布 (Peaky Distribution)

非归一化分布 (Non-normalized Distribution)

高维数据 (High-dimensional Data)

开放问题 这项研究留下的未解疑问

应用场景

近期应用

贝叶斯推断

蒙特卡罗方法

统计建模

远期愿景

高维数据处理

非归一化分布应用

原文摘要

参考文献 (20)

被引用 (6)

相关论文

A Divergence-Based Method for Weighting and Averaging Model Predictions

CLVAE: A Variational Autoencoder for Long-Term Customer Revenue Forecasting

Mixed Membership sub-Gaussian Models

Explanation of Dynamic Physical Field Predictions using WassersteinGrad: Application to Autoregressive Weather Forecasting

FedSPDnet: Geometry-Aware Federated Deep Learning with SPDnet

Pack only the essentials: Adaptive dictionary learning for kernel ridge regression

通俗解读非专业人士也能看懂

简单解释像给14岁少年讲一样

开放问题这项研究留下的未解疑问