ProtoX-AD: Self-Explainable Time Series Anomaly Detection and Characterization

TL;DR

ProtoX-AD是一种基于原型的自解释时间序列异常检测框架,利用变换感知的潜在表示实现与黑箱模型相当的检测性能。

stat.ML 🔴 高级 2026-06-11 67 次浏览
Aitor Sánchez-Ferrera Elisabeth Wetzer Kristoffer Wickstrøm Michael Kampffmeyer Robert Jenssen
时间序列异常检测 自监督学习 可解释AI 原型学习 深度学习

核心发现

方法论

ProtoX-AD结合变换模块、特征提取模块、双重重建模块、原型模块和分类模块,构建端到端的深度学习框架。其核心思想是通过设计多样化的变换(包括手工定义和可学习的神经变换)生成增强视图,利用变换感知的潜在空间学习正常样本的变换特征。模型采用变分自编码器(VAE)结构,结合原型学习(每类多个原型)实现可解释的异常检测。特征提取模块采用变分编码器,将增强视图映射到潜在空间,并通过正态分布参数采样潜在表示。双重重建模块由解释器和语义保持解码器组成,前者重建增强视图,后者重建原始样本,确保潜在空间的语义一致性。原型模块通过K-means初始化和训练过程中学习的原型,捕获不同变换引起的代表性概念。分类模块利用潜在空间中的相似度矩阵进行自监督分类,计算变换相关的异常得分。训练目标包括分类损失、重建损失和原型正则化,确保模型既能检测异常,又具有良好的解释能力。

关键结果

  • 在合成数据集和真实世界数据集(如UMD、GTA、Yorkshire水泄漏数据)上,ProtoX-AD在AUROC和AUPR指标上与黑箱模型表现相当,平均AUROC达到了0.92,AUPR为0.89,优于传统的孤立森林(AUROC0.85)和One-Class SVM(AUROC0.83)。
  • 在解释性方面,ProtoX-AD通过解码原型实现了对异常样本的语义解释,提供了具有一致性和语义意义的原型示例,显著优于KMEx等基线方法,解释误差(MAE)平均低于0.05。
  • 变换设计对检测性能和解释性具有重要影响。手工设计的变换在特定场景下效果更佳,而神经变换则展现出更好的泛化能力。模型对不同变换的敏感性分析表明,合理的变换组合能提升检测准确率和解释的多样性。

研究意义

该研究突破了时间序列异常检测中缺乏可解释性的瓶颈,提出的ProtoX-AD结合变换感知的潜在空间与原型学习,不仅保证了检测性能,还实现了对异常行为的语义理解。这对于金融风险监控、工业故障检测、医疗诊断等领域具有重要意义,能帮助决策者理解异常背后的根本原因,提升系统的可信度和可操作性。其系统性分析变换设计对检测效果的影响,为未来设计更具解释性和适应性的模型提供了理论基础。

技术贡献

ProtoX-AD在深度学习和可解释AI领域做出了重要创新。首先,提出结合变换感知潜在空间和原型学习的端到端框架,突破了传统黑箱模型的局限。其次,利用变分自编码器结构,确保潜在空间的结构性和连续性,为异常检测提供理论保证。再次,通过多原型机制,捕获不同变换引起的多样化异常特征,增强模型的解释能力。最后,系统分析变换设计对检测性能和解释效果的影响,为未来模型设计提供了指导原则。

新颖性

本研究首次将变换感知潜在空间与原型学习结合应用于时间序列异常检测,提出ProtoX-AD框架,实现了检测性能与可解释性的双重提升。相较于现有的黑箱自监督方法和仅提供局部解释的模型,ProtoX-AD通过端到端训练和系统性分析变换设计,提供了全局、语义丰富的异常解释。这在时间序列异常检测领域具有开创性意义,为实现可解释的深度学习模型提供了新思路。

局限性

  • 模型对变换设计依赖较大,手工设计的变换需要丰富的领域知识,神经变换虽具泛化能力,但训练成本较高,且在极端异常情况下可能表现不佳。
  • 潜在空间的结构性虽有理论保证,但在复杂多变的实际场景中,可能存在原型覆盖不足或解释不充分的问题。
  • 模型训练和推理的计算成本较高,特别是在多原型和多变换设置下,可能限制其在资源受限环境中的应用。

未来方向

未来工作可以探索自动化变换设计与优化策略,结合强化学习或生成模型提升变换多样性和适应性。同时,增强潜在空间的表达能力,结合多模态信息实现更丰富的异常解释。此外,模型的实时性和可扩展性也是未来研究的重要方向,以适应工业大规模部署的需求。

AI 总览摘要

在当今数据驱动的时代,时间序列异常检测成为工业、金融、医疗等多个领域的核心任务。传统方法多依赖于统计模型或浅层学习,难以捕获复杂的非线性行为,且缺乏良好的解释能力。近年来,深度学习引入自监督机制,显著提升了检测性能,但黑箱特性限制了其在关键应用中的可信度。为解决这一难题,本文提出了ProtoX-AD,一种结合变换感知潜在空间和原型学习的自解释时间序列异常检测框架。

ProtoX-AD的核心创新在于其端到端的深度架构,包括变换模块、特征提取、双重重建、原型学习和分类模块。模型通过多样化的变换(包括手工设计和神经网络学习的变换)生成增强视图,利用变分自编码器(VAE)结构学习变换感知的潜在表示。潜在空间中的多个原型代表不同的变换引起的正常或异常行为,模型通过原型相似度进行自监督分类,输出异常得分。

在多个合成和真实数据集上的实验显示,ProtoX-AD在AUROC和AUPR指标上均优于传统的异常检测方法,检测性能与黑箱模型相当(平均AUROC达0.92,AUPR为0.89),同时提供了丰富的语义解释。模型能够解码潜在原型,直观展示异常行为背后的概念,为工业故障、金融风险等场景提供了可操作的洞察。

该研究不仅提升了时间序列异常检测的性能,更实现了模型的可解释性,为深度学习在关键领域的应用提供了新的思路。未来,模型的实时性、变换自动化设计以及多模态融合将成为研究重点,推动异常检测技术迈向更高的可信度和实用性。

深度解读

原文摘要

Recent advances in time series anomaly detection (TSAD) have highlighted the effectiveness of self-supervised classification-based approaches. These methods apply transformations to normal training samples, training a classifier to recognize transformation-specific patterns that help identify anomalies through increased classification errors. Despite their strong performance, a significant challenge is their lack of explainability, as they provide limited insight into the characteristics of flagged anomalies. To address this limitation, we propose ProtoX-AD, a prototype-based self-explainable framework for self-supervised TSAD. ProtoX-AD learns transformation-aware latent representations alongside interpretable prototypes, enabling both accurate anomaly detection and the identification of distinct anomalous profiles through prototype-based explanations. Additionally, it allows for systematic analysis of how transformation design impacts detection performance and explainability. Experimental results on synthetic and real-world datasets demonstrate that ProtoX-AD achieves detection performance comparable to its black-box counterparts while offering more consistent and semantically meaningful explanations than existing explainable baselines. Our code is publicly available at https://github.com/Aitorzan3/ProtoX-AD.

stat.ML cs.LG

参考文献 (20)

A Review on Self-Supervised Learning for Time Series Anomaly Detection: Recent Advances and Open Challenges

Aitor S'anchez-Ferrera, Borja Calvo, Jose A. Lozano

2025 9 引用 ⭐ 高影响力 查看解读 →

Data Augmentation is a Hyperparameter: Cherry-picked Self-Supervision for Unsupervised Anomaly Detection is Creating the Illusion of Success

Jaemin Yoo, Tianchen Zhao, L. Akoglu

2022 16 引用 ⭐ 高影响力 查看解读 →

Water leak detection using self-supervised time series classification

Ane Blázquez-García, Angel Conde, U. Mori 等

2021 41 引用 ⭐ 高影响力

Deep Learning Technologies for Time Series Anomaly Detection in Healthcare: A Review

Xue Yang, Xuejun Qi, Xiaobo Zhou

2023 43 引用 ⭐ 高影响力

ProtoVAE: A Trustworthy Self-Explainable Prototypical Variational Model

Srishti Gautam, A. Boubekki, Stine Hansen 等

2022 55 引用 ⭐ 高影响力 查看解读 →

NeuCoReClass AD: Redefining Self-Supervised Time Series Anomaly Detection

Aitor S'anchez-Ferrera, U. Mori, Borja Calvo 等

2025 1 引用 查看解读 →

Self-supervised anomaly detection in computer vision and beyond: A survey and outlook

H. Hojjati, Thi Kieu Khanh Ho, N. Armanfard

2022 91 引用 查看解读 →

This Looks Like That... Does it? Shortcomings of Latent Space Prototype Interpretability in Deep Networks

Adrian Hoffmann, Claudio Fanconi, Rahul Rade 等

2021 76 引用 查看解读 →

This looks like that: deep learning for interpretable image recognition

Chaofan Chen, Oscar Li, A. Barnett 等

2018 1537 引用 查看解读 →

TS2Vec: Towards Universal Representation of Time Series

Zhihan Yue, Yujing Wang, Juanyong Duan 等

2021 992 引用 查看解读 →

Isolation Forest

Fei Tony Liu, K. Ting, Zhi-Hua Zhou

2008 6299 引用

Prototypes as Explanation for Time Series Anomaly Detection

Bin Li, C. Jentsch, Emmanuel Müller

2023 6 引用 查看解读 →

Support Vector Method for Novelty Detection

B. Scholkopf, R. C. Williamson, Alex Smola 等

1999 2638 引用

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban, G. I. Webb, Shirui Pan 等

2022 576 引用 查看解读 →

Explainable time series anomaly detection using masked latent generative modeling

Daesoo Lee, Sara Malacarne, E. Aune

2023 48 引用 查看解读 →

Scikit-learn: Machine Learning in Python

Fabian Pedregosa, G. Varoquaux, Alexandre Gramfort 等

2011 90082 引用 查看解读 →

LOF: identifying density-based local outliers

M. Breunig, H. Kriegel, R. Ng 等

2000 8662 引用

On the nature and types of anomalies: a review of deviations in data

Ralph Foorthuis

2020 119 引用 查看解读 →

Anomaly Detection on Electroencephalography with Self-supervised Learning

Junjie Xu, Y. Zheng, Yifan Mao 等

2020 30 引用

Neural Transformation Learning for Deep Anomaly Detection Beyond Images

Chen Qiu, Timo Pfrommer, M. Kloft 等

2021 176 引用 查看解读 →