A Data-Free Symbolic Regression Approach for Solving Equations

TL;DR

提出SES,无需训练数据,通过方程残差优化,成功恢复代数与微分方程的符号解。

cs.NE 🔴 高级 2026-06-05 39 次浏览
Sergei Garmaev Vinay Sharma Olga Fink
符号回归 微分方程 无数据 优化方法 符号表达式

核心发现

方法论

SES(符号方程求解器)将方程求解转化为差分可微符号模型空间中的优化问题。它利用方程本身及其边界或初值条件作为监督信号,无需配对输入输出数据。模型由符号网络表示,参数通过梯度下降优化,使残差最小化。优化完成后,将模型参数转化为显式符号表达式。该方法适用于代数和微分方程,包括线性、非线性、超越和偏微分方程。核心在于构建残差目标函数,将方程和条件的残差作为优化目标,利用自动微分计算导数,训练符号模型。模型架构基于EQL(Equation Learner)网络,采用符号操作库,最大深度为2,确保表达式的稀疏性和可解释性。训练过程分三阶段:初始残差优化、稀疏性正则化和微调,最终提取符号表达式。

关键结果

  • 在线性方程组(如2x+3y=7, x−y=1)中,SES成功恢复了精确的常数解(x=2, y=1),误差小于10^-5,验证了多变量符号解的联合优化能力。
  • 对于超越方程(x + x^3 = e + 1),SES准确识别出符号解x=1,误差控制在五位小数内,显示其处理复杂非线性方程的潜力。
  • 在微分方程方面,SES成功求解了非线性常微分方程(dy/dt=1−y^2,y(0)=0),复现了解析解tanh(t),以及一阶传输方程和二维Poisson方程,均获得与解析解高度一致的符号表达式,验证了其在微分方程中的适用性。

研究意义

该研究突破了传统符号回归和数值求解的局限,提出无需训练数据、直接基于方程残差的符号解法,为科学计算提供了全新工具。它不仅能揭示复杂方程的符号结构,还能应用于物理、工程等领域的模型解析,有望推动符号推理、自动定理证明和符号微分方程求解的发展。这一方法的核心创新在于将符号表达式的搜索融入到优化框架中,实现了从方程本身直接导出符号解的目标,极大地扩展了符号计算的应用范围和效率。

技术贡献

技术上,SES引入差分可微符号模型,结合自动微分和残差优化,突破了传统符号回归依赖数据的限制。它采用符号操作库,保证表达式的稀疏性和可解释性,同时通过多阶段训练策略提升模型的表达能力和稳定性。与PINNs等数值方法不同,SES直接获得显式符号表达式,便于后续分析。其创新点还在于将符号模型的参数优化与方程残差紧密结合,形成端到端的符号推理流程,为符号微分方程求解提供了理论基础和工程实现。

新颖性

这是首个将符号回归与方程残差优化相结合的框架,避免了对配对数据的依赖,能直接从方程本身学习符号解。不同于传统符号求解器受限于方程结构,SES通过优化符号模型参数,实现对复杂非线性、超越和微分方程的符号求解,开辟了符号推理的新路径。

局限性

  • 当前方法对符号操作库的表达能力有限,难以处理极其复杂或高阶的符号表达式,可能需要扩展操作库或引入更深层次的符号结构。
  • 优化过程依赖于良好的超参数设置和多次训练,存在局部最优的风险,尤其在高维或多变量问题中表现不稳定。
  • 在极端复杂的微分方程或边界条件条件下,模型可能无法完全收敛或精确还原符号解,未来需改进训练策略和模型结构。

未来方向

未来将探索更丰富的符号操作库,增强模型的表达能力;引入自适应采样和多尺度训练策略,提高复杂问题的求解精度;结合符号推理与机器学习,开发自动化的符号微分方程求解平台,推动符号AI在科学研究中的应用。

AI 总览摘要

在科学和工程领域,方程是描述自然规律和系统行为的核心工具。然而,许多复杂的方程难以通过传统解析方法求解,通常只能得到数值近似解。这些数值解虽然在精度上令人满意,但缺乏对方程结构的深刻理解,也难以进行进一步的分析。符号解作为一种直观、可解释的表达形式,能揭示变量之间的关系、对称性和潜在的规律,但传统符号求解器受限于方程的结构,难以应对复杂或超越的方程。

为此,本文提出了符号方程求解器(SES),一种基于优化的符号推理方法,突破了现有技术的限制。SES将方程求解转化为在符号模型空间中的差分优化问题,利用方程本身及其边界或初值条件作为监督信号,无需配对输入输出数据。通过构建残差目标函数,利用自动微分计算导数,训练符号模型,使其残差最小化,最终提取出符合方程的符号表达式。

实验结果显示,SES在多类微分和代数方程中表现出色。它成功恢复了线性方程组的精确常数解,处理超越方程的符号解,并在微分方程中准确还原解析解,包括非线性常微分方程、传输方程和二维Poisson方程。所有这些都在没有任何配对训练数据的情况下实现,验证了其广泛的适用性和强大潜力。

这一方法的核心创新在于将符号表达式的搜索融入到端到端的优化框架中,避免了传统符号回归对大量数据的依赖,极大地拓展了符号微分方程求解的应用场景。它不仅为科学计算提供了新工具,也为符号AI的发展开辟了新路径。未来,SES有望结合更丰富的符号操作库和自适应训练策略,成为自动化科学发现的重要支撑技术。

深度分析

研究背景

符号计算和微分方程求解是数学和科学的基础工具。早期的符号求解方法如Gröbner基和Liouvillian解法,能在特定条件下获得精确解,但受限于方程的结构,难以推广到复杂非线性或超越方程。近年来,符号回归技术如遗传编程(Genetic Programming)和深度学习方法(如Deep Symbolic Regression)试图从数据中自动发现符号表达式,但这些方法依赖大量的训练样本,且难以直接处理微分方程。另一方面,残差最小化的物理信息神经网络(PINNs)等数值方法能直接利用方程,但返回的是神经网络模型,缺乏明确的符号表达。本文的研究背景在于结合符号推理和方程残差优化,提出无需训练数据、直接从方程本身学习符号解的创新思路,旨在弥补现有方法的不足。

核心问题

当前符号求解器受限于方程的结构,难以应对复杂的非线性和超越方程,且传统方法无法处理缺乏解析解的微分方程。符号回归虽能从数据中学习表达式,但在缺少配对输入输出样本的情况下效果有限。数值方法如PINNs虽然可以逼近解,但无法提供明确的符号表达式,限制了对模型的深入分析。如何在没有训练样本的情况下,直接利用方程和边界条件,自动推导出符号解,成为亟待解决的核心问题。这不仅关系到符号微分方程的自动求解,也影响到科学发现的自动化程度。

核心创新

本研究的创新点在于提出SES框架,将符号解的搜索转化为差分可微模型的端到端优化问题。具体创新包括:• 利用方程残差作为唯一监督信号,无需配对数据;• 设计基于符号操作库的符号网络,确保表达式的稀疏性和可解释性;• 采用多阶段训练策略,结合残差最小化和稀疏正则,提升模型的表达能力和稳定性;• 通过自动微分计算导数,确保符号模型能准确反映微分关系。这些创新使得符号解的自动推导成为可能,突破了传统符号回归和数值求解的限制。

方法详解

  • �� 构建符号模型:采用基于EQL的符号网络,定义符号操作库(如恒等、常数、平方、指数、tanh、乘法),最大深度为2,保证表达式稀疏且易于优化。
  • �� 目标函数设计:将方程和边界条件的残差作为优化目标,构建残差损失函数。对于微分方程,利用自动微分计算导数,残差包括微分项和边界条件。
  • �� 采样与训练:在定义域内随机采样256个点作为collocation点,计算残差并进行梯度下降优化。训练分三阶段:初始残差优化、引入L1正则促进稀疏、微调以提升精度。
  • �� 结果提取:训练完成后,将符号网络中的参数转化为符号表达式,进行四舍五入,得到明确的符号解。
  • �� 多变量与系统:支持多未知数系统的联合优化,确保符号解的整体一致性。

实验设计

  • �� 采用多类方程进行验证,包括线性方程组、超越方程、非线性微分方程和偏微分方程。
  • �� 训练过程中不依赖任何配对输入输出数据,仅利用方程残差和边界条件。
  • �� 评估指标包括符号表达式的精确度、残差大小和符号结构的匹配程度。
  • �� 超参数设定:每个问题采样256个点,训练三阶段,采用Adam优化器,残差正则化和稀疏正则的结合。
  • �� 实验还包括对不同边界条件和复杂度的微分方程的适应性测试,验证模型的鲁棒性。

结果分析

  • �� 在线性方程组中,SES成功恢复了变量的常数解,误差小于10^-5,验证了多变量符号解的联合优化能力。
  • �� 在超越方程中,准确识别出符号解x=1,误差控制在五位小数内,显示其处理复杂非线性方程的潜力。
  • �� 在微分方程方面,成功还原了非线性常微分方程(dy/dt=1−y^2)和二维Poisson方程,符号表达式与解析解高度一致,误差在10^-4以内。
  • �� 实验结果表明,SES能在无监督条件下,准确提取多类方程的符号解,且符号表达式具有良好的解释性和泛化能力。

应用场景

  • �� 物理建模:自动推导复杂微分方程的符号表达式,辅助科学研究与工程设计。
  • �� 教育培训:作为符号推理的教学工具,帮助学生理解微分方程的结构。
  • �� 自动定理证明:结合符号推理和自动化验证,推动数学定理的自动发现和验证。
  • �� 工业应用:在控制系统、材料科学等领域,快速获得模型符号表达式,提升设计效率。

局限与展望

  • �� 当前模型对符号操作库的表达能力有限,难以处理高阶或极复杂的符号结构,未来需扩展操作库或引入深层符号结构。
  • �� 优化过程可能受局部最优影响,尤其在高维、多变量问题中表现不稳定。
  • �� 对极端复杂或边界条件特殊的微分方程,模型可能无法完全收敛或还原精确符号解,需改进训练策略和模型结构。

通俗解读 非专业人士也能看懂

想象你在厨房里做菜,目标是用最少的调料和步骤做出一道美味的菜肴。传统的方法可能是按照菜谱逐步尝试,或者用味觉判断是否合适。而这里的SES就像一个聪明的厨师,它不用菜谱,只看菜肴的味道(方程残差),通过不断调整调料(符号模型参数),最终找到最合适的调料组合(符号表达式),让菜肴完美符合预期的味道(满足方程条件)。这个厨师不需要尝试所有可能的调料组合,也不依赖事先的经验,而是直接根据味道反馈,优化调料比例,直到达到理想的味道。这就像SES通过优化残差,自动“调配”出符合复杂数学方程的符号解,既高效又直观。

简单解释 像给14岁少年讲一样

你知道在学校里学习数学方程吗?有时候,解一个复杂的方程就像拼拼图,但拼图的形状很奇怪,找不到正确的拼法。传统的方法就像用手去拼,试试不同的拼法,费时又不一定成功。而SES就像一个聪明的机器人,它不用试错,而是根据方程的规则,自己在脑袋里试着拼出答案。它会不断调整自己脑袋里的拼图块,直到拼出一个符合所有规则的答案。这个机器人不用看别人的答案,也不用大量的例题,只靠方程本身的“提示”就能找到答案。这样一来,解复杂的数学问题就变得更快、更智能,也更像是在用数学的“魔法”解决问题!

原文摘要

Many equations arising in science currently cannot be solved by available analytical techniques and are therefore solved numerically, without yielding explicit symbolic expressions. Existing symbolic regression approaches can recover symbolic expressions, but require training data obtained from the underlying process, rather than the governing equation alone. We propose the Symbolic Equation Solver (SES), a framework that formulates equation solving as an optimization problem over differentiable symbolic models. SES constructs its objective from the equation together with initial or boundary conditions, eliminating the need for paired input-output data. The learned model is expressed in explicit symbolic form, enabling further analysis. We evaluate SES on representative algebraic and differential equations, including a system of algebraic equations, an equation with transcendental terms, an ordinary differential equation, and partial differential equations with different initial or boundary conditions. Across these settings, SES recovers compact symbolic expressions that match the corresponding analytical solutions.

cs.NE cs.SC

参考文献 (20)

Modern computer algebra

J. Gathen, Jürgen Gerhard

2002 2092 引用

Ideals, Varieties, and Algorithms: An Introduction to Computational Algebraic Geometry and Commutative Algebra

David A. Cox, J. Little, D. O'Shea

1992 3058 引用

Review of PySR: high-performance symbolic regression in Python and Julia

A. Tonda

2024 32 引用

DGM: A deep learning algorithm for solving partial differential equations

Justin A. Sirignano, K. Spiliopoulos

2017 2479 引用 查看解读 →

Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations

M. Raissi, P. Perdikaris, G. Karniadakis

2019 17196 引用

Neural Symbolic Regression that Scales

Luca Biggio, Tommaso Bendinelli, Alexander Neitz 等

2021 261 引用 查看解读 →

Extrapolation and learning equations

G. Martius, Christoph H. Lampert

2016 207 引用 查看解读 →

Interactive symbolic regression with co-design mechanism through offline reinforcement learning

Yuan Tian, Wenqi Zhou, Michele Viscione 等

2025 17 引用

End-to-end symbolic regression with transformers

Pierre-Alexandre Kamienny, Stéphane d'Ascoli, Guillaume Lample 等

2022 282 引用 查看解读 →

Complex Equation Learner: Rational Symbolic Regression with Gradient Descent in Complex Domain

S. Garmaev, Maurice Gauch'e, Olga Fink

2026 1 引用 查看解读 →

Symbolic computation in algebra, geometry, and differential equations

Franz Winkler

2024 3 引用

Interpretable scientific discovery with symbolic regression: a review

N. Makke, S. Chawla

2022 304 引用 查看解读 →

Genetic programming as a means for programming computers by natural selection

J. Koza

1994 1500 引用

An Algorithm for Solving Second Order Linear Homogeneous Differential Equations

Jerald J. Kovacic

1986 497 引用

Learning Equations for Extrapolation and Control

Subham S. Sahoo, Christoph H. Lampert, G. Martius

2018 294 引用 查看解读 →

Artificial neural networks for solving ordinary and partial differential equations

I. Lagaris, A. Likas, D. Fotiadis

1997 2669 引用 查看解读 →

Discovering governing equations from data by sparse identification of nonlinear dynamical systems

S. Brunton, J. Proctor, J. Kutz

2015 5014 引用 查看解读 →

Informed Equation Learning

M. Werner, Andrej Junginger, Philipp Hennig 等

2021 21 引用 查看解读 →

Deep symbolic regression: Recovering mathematical expressions from data via risk-seeking policy gradients

Brenden K. Petersen, Mikel Landajuela

2019 464 引用 查看解读 →

The Deep Ritz Method: A Deep Learning-Based Numerical Algorithm for Solving Variational Problems

E. Weinan, Ting Yu

2017 1808 引用 查看解读 →