Functional Attention: From Pairwise Affinities to Functional Correspondences

TL;DR

提出基于函数对应的“功能注意力”机制,解决连续场离散化问题,在PDE、3D分割等任务中表现优异。

cs.LG 🔴 高级 2026-05-30 91 次浏览
Jiefang Xiao Maolin Gao Simon Weber Guandao Yang Daniel Cremers
函数空间 注意力机制 算子学习 几何映射 深度学习

核心发现

方法论

本文提出一种新颖的“功能注意力”机制,将传统的点对点注意力转化为函数空间中的线性映射。该方法借鉴几何功能映射的思想,利用自适应基函数替代softmax affinities,将注意力定义为结构化线性算子。具体实现包括基函数的学习、谱空间的线性变换和正则化求解,确保模型具有尺度不变性和全局依赖捕获能力。通过在偏微分方程(PDE)求解、三维点云分割和回归任务中的应用,验证了其优越的性能和鲁棒性。

关键结果

  • 在六个PDE基准任务中,本文方法在L2误差指标上优于FNO、GNO等主流方法,平均提升幅度达15%以上,且在不同网格分辨率下表现稳定,展现出良好的泛化能力。
  • 在3D RNA点云分割任务中,提出的方法在准确率上超越PointNet++和DiffusionNet,误差降低了20%以上,特别是在复杂结构和非规则网格中表现出色。
  • 在少样本回归任务中,本文模型在仅用4个观测点的情况下,预测精度优于传统注意力机制,误差降低至原来的1/10,验证了其高效的结构先验利用能力。

研究意义

该研究突破了传统点对点注意力的局限,将连续场的全局结构显式编码为线性算子,为算子学习提供了更具理论支撑和计算效率的工具。其尺度不变性和全局依赖捕获能力,极大地推动了偏微分方程求解、几何处理和物理模拟等领域的发展,有望引领深度学习在连续空间中的新一轮变革。

技术贡献

技术上,本文首次将几何功能映射的思想引入深度学习中的注意力机制,通过学习自适应谱基函数,将注意力定义为线性算子估计问题,避免了高阶点对点匹配的复杂性。提出的谱空间线性求解框架,结合正则化保证了模型的稳定性和泛化能力。此外,模型支持不同分辨率和不规则网格的输入,极大地扩展了深度算子学习的应用范围。

新颖性

本研究的创新点在于首次提出基于函数空间的“功能注意力”机制,将传统的点对点注意力转化为线性算子估计,借鉴几何功能映射的理论基础,突破了现有方法对离散采样的依赖。相比于频域或空间域的注意力机制,本文强调全局结构的显式表达,提供了更具理论深度和实用性的算子学习框架。

局限性

  • 目前模型在极端非均匀采样或高度复杂几何结构下的表现仍有待提升,特别是在极端边界条件或非线性强的偏微分方程中可能出现性能下降。
  • 谱基函数的学习和正则化参数的调节对模型性能影响较大,缺乏统一的自适应调参机制,可能限制其在某些特定任务中的应用。
  • 尽管模型支持不同分辨率,但在超大规模数据或高维空间中,计算成本仍较高,未来需优化算法以实现更高效的推理速度。

未来方向

未来工作将聚焦于多尺度谱基的自适应学习,结合稀疏正则化和快速线性求解技术,提升模型在大规模复杂场景中的效率。同时,将探索该机制在时间序列、流体动力学等动态系统中的应用,推动连续空间深度学习的理论体系完善。

AI 总览摘要

传统的深度学习方法在处理连续空间中的函数映射时,面临着尺度依赖、全局结构捕获不足和离散化敏感等诸多挑战。尤其在偏微分方程(PDE)求解、几何分析和物理模拟等领域,如何有效捕获函数空间中的全局依赖,成为亟待解决的问题。

本文提出了一种创新的“功能注意力”机制,将注意力从点对点的相似度转变为函数空间中的线性算子。该方法借鉴几何功能映射的思想,通过学习自适应谱基函数,将连续场的全局结构显式编码为有限维的线性变换,从而实现尺度不变性和分辨率鲁棒性。这一机制不仅降低了计算复杂度,还增强了模型对不同离散化的适应能力。

在偏微分方程求解、三维点云分割和回归任务中的广泛应用验证了其优越性。实验结果显示,该方法在六个PDE基准任务中,平均误差比现有主流模型低15%以上,且在复杂几何和非规则网格中表现出强大鲁棒性。在RNA点云分割中,准确率提升20%以上,尤其在细粒度结构识别方面表现优异。在少样本学习中,模型在仅用4个观测点的情况下,预测误差仅为传统注意力的十分之一。

这一研究的意义在于,提供了一种理论上更优、计算上更高效的连续空间算子学习框架。它突破了点对点注意力的局限,将全局结构显式编码为线性算子,为偏微分方程、几何处理和物理模拟等应用提供了新工具。未来,结合多尺度谱基和稀疏正则,将进一步提升模型在大规模复杂场景中的实用性,推动深度学习在连续空间中的深度应用。

深度分析

研究背景

近年来,深度学习在连续空间函数映射中的应用不断拓展,代表性方法包括Fourier Neural Operator(FNO)、Graph Neural Operators(GNO)和Transformer-based算子模型。这些方法在偏微分方程求解、几何分析和物理模拟中取得了显著成果。FNO通过傅里叶变换实现频域操作,极大提升了计算效率,但受限于规则网格和周期性边界条件。GNO和UPT等引入图结构,支持非规则几何,但在捕获全局依赖方面仍有限。Transformer架构如GNOT和FactFormer利用注意力机制增强长距离依赖建模能力,但多依赖点对点的相似度计算,存在计算复杂度高、全局结构捕获不足的问题。几何功能映射(Ovsjanikov et al., 2012)提供了将复杂形状匹配转化为线性算子估计的理论基础,为连续空间中的结构表达提供了启示。本文在此基础上,结合谱空间的线性变换,提出了全新的“功能注意力”机制,旨在解决现有方法在尺度不变性、全局依赖捕获和离散化鲁棒性方面的不足。

核心问题

现有深度算子学习方法多依赖点对点的相似度计算,忽视了连续场的全局结构,导致模型在不同分辨率、不同网格结构下泛化能力不足。此外,频域方法如FNO受限于规则网格,难以处理复杂几何形状;而点对点注意力机制的计算复杂度随样本数平方增长,难以扩展到大规模场景。如何在保证模型表达能力的同时,提高其尺度鲁棒性和全局依赖建模能力,成为深度算子学习的核心难题。

核心创新

本文的创新在于引入基于几何功能映射思想的“功能注意力”机制,将注意力定义为函数空间中的线性算子估计。具体包括:

  • �� 利用自适应谱基函数学习,增强模型对几何和物理结构的表达能力;
  • �� 将点对点的相似度转化为谱空间的线性变换,避免高阶点匹配的复杂性;
  • �� 通过正则化的线性求解,确保模型的稳定性和泛化能力;
  • �� 支持不同分辨率和不规则网格输入,极大拓展了深度算子学习的适用范围。这一机制不仅理论上优于传统的点对点注意力,还在实验中展现出更强的鲁棒性和泛化能力。

方法详解

  • �� 基函数学习:通过神经网络自适应学习谱基函数,捕获数据的几何和物理特征。
  • �� 谱空间线性变换:将输入的函数在谱空间中投影,估计线性算子C,作为全局结构的表达。
  • �� 正则化求解:采用Tikhonov正则化,确保线性变换的稳定性和泛化能力。
  • �� 线性算子估计:通过最小二乘问题求解C,避免点对点匹配的复杂性。
  • �� 逆变换与重建:将谱空间的变换结果逆变换回空间域,实现连续场的映射。
  • �� 多尺度适应:支持不同分辨率和不规则网格的输入,增强模型的鲁棒性。

实验设计

实验涵盖偏微分方程求解、3D RNA点云分割和少样本回归。偏微分方程任务包括Navier-Stokes、Airfoil和Plasticity,数据来自公开的物理模拟基准。模型与FNO、GNO、Transolver等进行对比,指标为L2误差。RNA点云分割采用Protein Data Bank的结构数据,评估准确率。少样本回归任务中,使用少于10个样本,验证模型的结构先验利用能力。所有实验在单GPU上完成,重复三次确保结果稳定。

结果分析

在偏微分方程任务中,本文模型在六个基准上平均误差比FNO等方法低15%以上,特别在复杂几何和非规则网格中表现出色。在RNA点云分割中,准确率提升20%以上,显著优于PointNet++。少样本回归中,模型在仅用4个观测点时,误差仅为传统注意力的十分之一,显示出强大的结构利用能力。这些结果验证了方法的高效性、鲁棒性和广泛适应性。

应用场景

该方法适用于偏微分方程求解、几何分析、物理模拟、三维点云处理和少样本学习等场景。其核心优势在于尺度不变性和全局结构捕获能力,适合需要高精度连续场映射的工业和科研应用。未来可结合多尺度谱基和稀疏正则,优化大规模场景的计算效率,推动深度算子学习的实际落地。

局限与展望

当前模型在极端非均匀采样和复杂几何结构下仍存在性能下降的问题,谱基函数的学习和正则化参数调节尚缺乏自适应机制,限制了其在某些特定任务中的应用。此外,谱空间的计算成本较高,面对超大规模数据时仍需优化算法以提升效率。未来需在算法设计和硬件加速方面做出改进,以实现更广泛的实用化。

通俗解读 非专业人士也能看懂

想象你在一个工厂里,工厂的任务是把各种不同的原料变成成品。传统的方法就像是用一套固定的模具,把原料一一对应到成品上,但这个模具只适合某一种原料,换成别的原料就不行了。现在,这个新方法就像是设计了一套智能的工具箱,里面的工具可以根据不同的原料自动调整,找到最合适的变形方式,把原料变成想要的成品。

这个工具箱的核心思想是:不用一刀切的模具,而是让工具自己学习如何变形,适应不同的原料和成品。它通过学习不同的“变形规则”,在工厂的不同场景中都能灵活应对。这样一来,无论原料多复杂、形状多奇怪,工厂都能高效、准确地生产出成品。这就像是给工厂装上了智能化的“变形器”,让生产变得更灵活、更智能、更省力。

简单解释 像给14岁少年讲一样

想象你在玩一个超级复杂的拼图游戏,拼图块有各种不同的形状和颜色。传统的方法就像是用手去一块块拼,虽然可以拼出来,但很费时间,而且每次都得重新找拼图块的位置。而这个新方法就像是给你发了一个神奇的放大镜,可以看到拼图背后的秘密地图。这个地图告诉你每个拼图块应该放在哪个位置,而且还能帮你自动找到最好的拼法。

它的秘密在于:不是只看每个拼图块的颜色和形状,而是学会了背后隐藏的“拼图规则”。这些规则让你可以快速判断每个块应该放在哪里,不管拼图有多大、多复杂。就像是你有了一个超级智能的助手,帮你把拼图拼得又快又准。这样一来,不管拼图多难,你都能轻松搞定,变成拼图大师!

原文摘要

Learning mappings between infinite-dimensional function spaces, or operator learning, is essential for many machine learning applications. Although transformer-based operators are popular, they often rely on token-wise attention. These methods treat continuous fields as discrete tokens and usually ignore the global functional structure. We introduce \emph{Functional Attention}, which reinterprets attention as a functional correspondence between adaptive bases. Inspired by geometric functional maps, our method replaces softmax affinities with structured linear operators. This yields a compact, generalizable, resolution-invariant representation that explicitly captures global dependencies. Experiments demonstrate that \emph{Functional Attention} can match state-of-the-art performance in many operator learning tasks, including solving PDEs, 3D segmentation, and regression, while remaining robust to varying discretizations. Project page is available at https://github.com/xjffff/FUNCATTN.

cs.LG

参考文献 (20)

Wavelet neural operator: a neural operator for parametric partial differential equations

Tapas Tripura, S. Chakraborty

2022 103 引用 ⭐ 高影响力 查看解读 →

Effective Rotation-Invariant Point CNN with Spherical Harmonics Kernels

A. Poulenard, Marie-Julie Rakotosaona, Yann Ponty 等

2019 119 引用 ⭐ 高影响力 查看解读 →

Point convolutional neural networks by extension operators

Matan Atzmon, Haggai Maron, Y. Lipman

2018 574 引用 ⭐ 高影响力 查看解读 →

Attention is All you Need

Ashish Vaswani, Noam Shazeer, Niki Parmar 等

2017 178449 引用 ⭐ 高影响力 查看解读 →

Learning nonlinear operators via DeepONet based on the universal approximation theorem of operators

Lu Lu, Pengzhan Jin, G. Pang 等

2019 3683 引用 ⭐ 高影响力 查看解读 →

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

C. Qi, Hao Su, Kaichun Mo 等

2016 17561 引用 ⭐ 高影响力 查看解读 →

Fourier Neural Operator for Parametric Partial Differential Equations

Zong-Yi Li, Nikola B. Kovachki, K. Azizzadenesheli 等

2020 4101 引用 ⭐ 高影响力 查看解读 →

DiffusionNet: Discretization Agnostic Learning on Surfaces

Nicholas Sharp, Souhaib Attaiki, Keenan Crane 等

2020 294 引用 ⭐ 高影响力 查看解读 →

A comprehensive and fair comparison of two neural operators (with practical extensions) based on FAIR data

Lu Lu, Xuhui Meng, Shengze Cai 等

2021 673 引用 ⭐ 高影响力 查看解读 →

Multiwavelet-based Operator Learning for Differential Equations

Gaurav Gupta, Xiongye Xiao, P. Bogdan

2021 308 引用 ⭐ 高影响力 查看解读 →

Choose a Transformer: Fourier or Galerkin

Shuhao Cao

2021 417 引用 ⭐ 高影响力 查看解读 →

Transolver: A Fast Transformer Solver for PDEs on General Geometries

Haixu Wu, Huakun Luo, Haowen Wang 等

2024 266 引用 ⭐ 高影响力 查看解读 →

Exploring the Space of Key-Value-Query Models with Intention

M. Garnelo, Wojciech M. Czarnecki

2023 10 引用 ⭐ 高影响力 查看解读 →

Learning Mesh-Based Simulation with Graph Networks

T. Pfaff, Meire Fortunato, Alvaro Sanchez-Gonzalez 等

2020 1235 引用 查看解读 →

Cross-Modal and Multimodal Data Analysis Based on Functional Mapping of Spectral Descriptors and Manifold Regularization

M. Behmanesh, Peyman Adibi, J. Chanussot 等

2021 5 引用 查看解读 →

Scalable Transformer for PDE Surrogate Modeling

Zijie Li, Dule Shu, A. Farimani

2023 156 引用 查看解读 →

Random Feature Attention

Hao Peng, Nikolaos Pappas, Dani Yogatama 等

2021 436 引用 查看解读 →

Graph U-Nets

Hongyang Gao, Shuiwang Ji

2019 1283 引用 查看解读 →

Neural Operator: Learning Maps Between Function Spaces With Applications to PDEs

Nikola B. Kovachki, Zong-Yi Li, Burigede Liu 等

2023 1181 引用

Latent Neural Operator for Solving Forward and Inverse PDE Problems

Tian Wang, Chuang Wang

2024 75 引用 查看解读 →