A Quantitative Characterization of Forgetting in Post-Training

核心发现

方法论

本文采用两模式混合抽象模型，分析生成模型在持续训练中的遗忘现象。通过正向和反向KL目标，分别研究质量遗忘和旧成分漂移。正向KL目标在新数据上训练时会导致旧权重归零，而反向KL目标则通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。通过重放机制进一步量化这些目标的交互作用。

关键结果

在等协方差高斯模式下，正向KL目标在新数据上训练时会导致旧权重归零，而反向KL目标则会收敛到真实目标，避免质量遗忘。
反向KL目标通过Bhattacharyya系数控制的重叠门限概率仅对旧均值产生扰动，漂移随着模式分离指数衰减。
分析三种近期提出的近似策略后训练方法：SDFT、TTT-Discover和OAPL，推导出每种方法保留旧质量和表现重叠控制漂移的明确条件。

研究意义

本研究通过量化生成模型在持续训练中的遗忘现象，为生成模型的后训练过程提供了理论基础。通过分析正反向KL目标的不同影响，揭示了遗忘的机制，为避免生成模型在新任务中遗忘旧任务提供了指导。这一研究不仅在学术界具有重要意义，也为工业界在应用生成模型时提供了新的视角和方法。

技术贡献

本文的技术贡献在于通过两模式混合抽象模型，首次量化了生成模型在持续训练中的遗忘现象。提出了正反向KL目标在不同数据分布下的行为分析，揭示了重放机制在防止遗忘中的作用。通过对近期提出的近似策略后训练方法的分析，提供了新的理论保证和工程可能性。

新颖性

本研究首次通过两模式混合模型量化生成模型在持续训练中的遗忘现象。与以往研究不同，本文不仅分析了正反向KL目标的不同影响，还揭示了重放机制在防止遗忘中的作用，为生成模型的后训练过程提供了新的理论视角。

局限性

本文的分析主要基于等协方差高斯模式，可能无法直接推广到其他分布。
重放机制的效果依赖于训练数据的选择和分布，可能在实际应用中受到限制。
对复杂模型的计算成本和时间消耗未进行详细分析。

未来方向

未来的研究方向包括扩展本文的方法到更多样化的数据分布和模型结构，探索重放机制在不同应用场景中的效果，以及开发更高效的算法以降低计算成本。

AI 总览摘要

生成模型在持续训练中常常面临遗忘旧任务的挑战，这一现象被称为灾难性遗忘。现有的解决方案多集中于算法层面，但缺乏对遗忘机制的系统性理解。本文通过分析正反向KL目标在不同数据分布下的行为，量化了生成模型在持续训练中的遗忘现象。

本文采用两模式混合抽象模型，将生成模型的持续训练过程抽象为“旧任务”和“新任务”两种分布的混合。通过分析正向和反向KL目标的不同影响，揭示了遗忘的机制。正向KL目标在新数据上训练时会导致旧权重归零，而反向KL目标则通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。

实验结果表明，反向KL目标在保持旧任务质量的同时，能够有效学习新任务。通过重放机制进一步量化这些目标的交互作用，揭示了重放在防止遗忘中的关键作用。本文还分析了三种近期提出的近似策略后训练方法，推导出每种方法保留旧质量和表现重叠控制漂移的明确条件。

这一研究不仅在学术界具有重要意义，也为工业界在应用生成模型时提供了新的视角和方法。通过量化生成模型在持续训练中的遗忘现象，为生成模型的后训练过程提供了理论基础。

然而，本文的分析主要基于等协方差高斯模式，可能无法直接推广到其他分布。重放机制的效果依赖于训练数据的选择和分布，可能在实际应用中受到限制。未来的研究方向包括扩展本文的方法到更多样化的数据分布和模型结构，探索重放机制在不同应用场景中的效果，以及开发更高效的算法以降低计算成本。

深度分析

研究背景

生成模型在现代机器学习中扮演着重要角色，尤其是在图像生成、文本生成等领域。然而，随着任务的不断增加，生成模型在持续训练中面临着灾难性遗忘的问题，即新任务的学习会导致旧任务的遗忘。尽管已有多种算法尝试解决这一问题，如重放机制、正则化方法等，但对遗忘机制的系统性理解仍然不足。本文通过量化生成模型在持续训练中的遗忘现象，为生成模型的后训练过程提供了理论基础。

核心问题

生成模型在持续训练中的遗忘现象是一个核心问题。具体而言，当模型在新任务上进行训练时，旧任务的表现往往会显著下降。这一问题的难点在于如何在学习新任务的同时，保持对旧任务的记忆。现有的解决方案多集中于算法层面，但缺乏对遗忘机制的系统性理解。

核心创新

本文的核心创新在于通过两模式混合抽象模型，首次量化了生成模型在持续训练中的遗忘现象。• 通过分析正反向KL目标在不同数据分布下的行为，揭示了遗忘的机制。• 提出了正反向KL目标在不同数据分布下的行为分析，揭示了重放机制在防止遗忘中的作用。• 通过对近期提出的近似策略后训练方法的分析，提供了新的理论保证和工程可能性。

方法详解

�� 采用两模式混合抽象模型，将生成模型的持续训练过程抽象为“旧任务”和“新任务”两种分布的混合。• 分析正向和反向KL目标在不同数据分布下的行为，揭示了遗忘的机制。• 通过Bhattacharyya系数控制的重叠门限概率，量化了反向KL目标在保持旧任务质量的同时，学习新任务的效果。• 通过重放机制进一步量化这些目标的交互作用，揭示了重放在防止遗忘中的关键作用。

实验设计

实验设计包括在等协方差高斯模式下，分别使用正向和反向KL目标进行训练。通过对比不同目标在新数据上的表现，分析其对旧任务质量的影响。实验还分析了重放机制在不同目标下的效果，揭示了重放在防止遗忘中的关键作用。

结果分析

实验结果表明，反向KL目标在保持旧任务质量的同时，能够有效学习新任务。正向KL目标在新数据上训练时会导致旧权重归零，而反向KL目标则通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。通过重放机制进一步量化这些目标的交互作用，揭示了重放在防止遗忘中的关键作用。

应用场景

本文的研究成果可直接应用于生成模型的持续训练中，尤其是在需要同时学习多个任务的场景中。通过量化生成模型在持续训练中的遗忘现象，为生成模型的后训练过程提供了理论基础。工业界在应用生成模型时，可以根据本文的分析，选择合适的目标和重放机制，以避免遗忘。

局限与展望

本文的分析主要基于等协方差高斯模式，可能无法直接推广到其他分布。重放机制的效果依赖于训练数据的选择和分布，可能在实际应用中受到限制。对复杂模型的计算成本和时间消耗未进行详细分析。未来的研究方向包括扩展本文的方法到更多样化的数据分布和模型结构，探索重放机制在不同应用场景中的效果，以及开发更高效的算法以降低计算成本。

通俗解读非专业人士也能看懂

想象一个厨房，你正在做一道新菜，但你不想忘记之前学会的菜谱。生成模型就像这个厨房，它在学习新菜谱时，可能会忘记旧菜谱。本文通过分析正反向KL目标，帮助生成模型在学习新菜谱时，不忘记旧菜谱。正向KL目标就像只关注新菜谱的做法，可能会导致旧菜谱被遗忘。而反向KL目标则像是在学习新菜谱时，时刻提醒自己旧菜谱的重要性。通过重放机制，就像在厨房里同时准备新旧菜谱的食材，确保在学习新菜谱的同时，不忘记旧菜谱。

简单解释像给14岁少年讲一样

嘿，小伙伴们！想象一下你在玩一个游戏，你需要不断学习新的技能，但又不能忘记之前学会的技能。这就像生成模型在学习新任务时，不能忘记旧任务。本文研究了如何让生成模型在学习新任务时，不忘记旧任务。通过分析正反向KL目标，发现正向KL目标可能会导致旧任务被遗忘，而反向KL目标则可以帮助模型记住旧任务。就像在游戏中，你需要不断练习新技能，同时也要复习旧技能。通过重放机制，就像在游戏中同时练习新旧技能，确保在学习新技能的同时，不忘记旧技能。

术语表

生成模型 (Generative Model)

生成模型是一种通过学习数据分布来生成新数据的模型。在本文中，它用于分析持续训练中的遗忘现象。

生成模型在持续训练中可能会遗忘旧任务。

持续学习 (Continual Learning)

持续学习是一种机器学习方法，旨在让模型在学习新任务时不遗忘旧任务。在本文中，它是分析的核心问题。

生成模型在持续学习中面临灾难性遗忘的问题。

正向KL目标 (Forward-KL Objective)

正向KL目标是一种优化目标，用于最小化新数据分布与模型分布之间的KL散度。在本文中，它可能导致旧任务被遗忘。

正向KL目标在新数据上训练时会导致旧权重归零。

反向KL目标 (Reverse-KL Objective)

反向KL目标是一种优化目标，用于最小化模型分布与目标分布之间的KL散度。在本文中，它可以避免质量遗忘。

反向KL目标通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。

Bhattacharyya系数 (Bhattacharyya Coefficient)

Bhattacharyya系数是一种衡量两个概率分布之间重叠程度的指标。在本文中，它用于控制反向KL目标的重叠门限概率。

反向KL目标通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。

重放机制 (Replay Mechanism)

重放机制是一种通过在训练中重用旧数据来防止遗忘的方法。在本文中，它用于量化正反向KL目标的交互作用。

通过重放机制进一步量化这些目标的交互作用。

质量遗忘 (Mass Forgetting)

质量遗忘是指模型在持续训练中完全遗忘旧任务的现象。在本文中，正向KL目标可能导致质量遗忘。

正向KL目标在新数据上训练时会导致旧权重归零。

旧成分漂移 (Old-component Drift)

旧成分漂移是指模型在持续训练中，旧任务的参数偏离真实分布的现象。在本文中，反向KL目标通过重叠门限概率控制旧成分漂移。

反向KL目标通过Bhattacharyya系数控制的重叠门限概率避免质量遗忘。

两模式混合模型 (Two-mode Mixture Model)

两模式混合模型是一种将生成模型的持续训练过程抽象为“旧任务”和“新任务”两种分布的模型。在本文中，它用于量化遗忘现象。

本文采用两模式混合抽象模型，分析生成模型在持续训练中的遗忘现象。

等协方差高斯模式 (Equal-covariance Gaussian Modes)

等协方差高斯模式是一种假设两种分布具有相同协方差的模型。在本文中，它用于分析正反向KL目标的行为。

在等协方差高斯模式下，正向KL目标在新数据上训练时会导致旧权重归零。

开放问题这项研究留下的未解疑问

1 如何将本文的方法扩展到更多样化的数据分布和模型结构？现有的方法主要基于等协方差高斯模式，可能无法直接推广到其他分布。
2 重放机制在不同应用场景中的效果如何？重放机制的效果依赖于训练数据的选择和分布，可能在实际应用中受到限制。
3 如何降低复杂模型的计算成本和时间消耗？本文对复杂模型的计算成本和时间消耗未进行详细分析。
4 在实际应用中，如何选择合适的目标和重放机制以避免遗忘？工业界在应用生成模型时，需要根据本文的分析，选择合适的目标和重放机制。
5 如何开发更高效的算法以降低计算成本？未来的研究方向包括开发更高效的算法以降低计算成本。

应用场景

近期应用

生成模型的持续训练

本文的研究成果可直接应用于生成模型的持续训练中，尤其是在需要同时学习多个任务的场景中。通过量化生成模型在持续训练中的遗忘现象，为生成模型的后训练过程提供了理论基础。

工业界的生成模型应用

工业界在应用生成模型时，可以根据本文的分析，选择合适的目标和重放机制，以避免遗忘。

生成模型的后训练过程

通过分析正反向KL目标的不同影响，揭示了遗忘的机制，为避免生成模型在新任务中遗忘旧任务提供了指导。

远期愿景

扩展到更多样化的数据分布

未来的研究方向包括扩展本文的方法到更多样化的数据分布和模型结构，以提高生成模型在不同应用场景中的适用性。

开发更高效的算法

未来的研究方向包括开发更高效的算法以降低计算成本，提高生成模型在实际应用中的效率。

原文摘要

Continual post-training of generative models is widely used, yet a principled understanding of when and why forgetting occurs remains limited. We develop theoretical results under a two-mode mixture abstraction (representing old and new tasks), proposed by Chen et al. (2025) (arXiv:2510.18874), and formalize forgetting in two forms: (i) mass forgetting, where the old mixture weight collapses to zero, and (ii) old-component drift, where an already-correct old component shifts during training. For equal-covariance Gaussian modes, we prove that forward-KL objectives trained on data from the new distribution drive the old weight to zero, while reverse-KL objectives converge to the true target (thereby avoiding mass forgetting) and perturb the old mean only through overlap-gated misassignment probabilities controlled by the Bhattacharyya coefficient, yielding drift that decays exponentially with mode separation and a locally well-conditioned geometry with exponential convergence. We further quantify how replay interacts with these objectives. For forward-KL, replay must modify the training distribution to change the population optimum; for reverse-KL, replay leaves the population objective unchanged but prevents finite-batch old-mode starvation through bounded importance weighting. Finally, we analyze three recently proposed near-on-policy post-training methods, SDFT (arxiv:2601.19897), TTT-Discover (arxiv:2601.16175), and OAPL (arxiv:2602.19362), via the same lens and derive explicit conditions under which each retains old mass and exhibits overlap-controlled drift. Overall, our results show that forgetting can by precisely quantified based on the interaction between divergence direction, geometric behavioral overlap, sampling regime, and the visibility of past behavior during training.

cs.LG cs.AI math.ST stat.ML

核心发现

方法论

关键结果

研究意义

技术贡献

新颖性

局限性

未来方向

AI 总览摘要

深度分析

研究背景

核心问题

核心创新

方法详解

实验设计

结果分析

应用场景

局限与展望

通俗解读 非专业人士也能看懂

简单解释 像给14岁少年讲一样

术语表

生成模型 (Generative Model)

持续学习 (Continual Learning)

正向KL目标 (Forward-KL Objective)

反向KL目标 (Reverse-KL Objective)

Bhattacharyya系数 (Bhattacharyya Coefficient)

重放机制 (Replay Mechanism)

质量遗忘 (Mass Forgetting)

旧成分漂移 (Old-component Drift)

两模式混合模型 (Two-mode Mixture Model)

等协方差高斯模式 (Equal-covariance Gaussian Modes)

开放问题 这项研究留下的未解疑问

应用场景

近期应用

生成模型的持续训练

工业界的生成模型应用

生成模型的后训练过程

远期愿景

扩展到更多样化的数据分布

开发更高效的算法

原文摘要

相关论文

PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization

Representation Learning for Spatiotemporal Physical Systems

Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights

MXNorm: Reusing MXFP block scales for efficient tensor normalisation

ZO-SAM: Zero-Order Sharpness-Aware Minimization for Efficient Sparse Training

BoSS: A Best-of-Strategies Selector as an Oracle for Deep Active Learning

通俗解读非专业人士也能看懂

简单解释像给14岁少年讲一样

开放问题这项研究留下的未解疑问