核心发现
方法论
本文提出结合多目标遗传编程(GP-GOMEA)演化特征集与生存树的结构优化策略,旨在提升浅层生存树的预测准确性与可解释性。具体方法包括:• 采用多目标优化框架,将模型性能(基于集成Brier分数IBS)与模型复杂度(特征表达式长度)作为目标;• 利用GP-GOMEA生成高表达能力的非线性特征,增强浅层树模型的表达能力;• 提出联合演化策略,优化树结构与分裂逻辑,避免贪婪算法的局部最优;• 设计多种树诱导策略(贪婪、全局最优、进化)结合不同深度(2或3层)进行实验;• 在两个真实临床数据集(GBSG和METABRIC)上验证方法效果,采用IBS和Harrell C指数作为性能指标。
关键结果
- 在两个数据集上,利用演化特征集显著提升浅层生存树的预测性能,IBS平均提升约8-12%,其中全联合演化策略在深度为3时表现最佳,IBS达0.074(基线为0.106);
- 不同树诱导策略中,联合演化树结构与特征逻辑的模型在复杂关系(如XOR问题)中表现出优越的捕获能力,验证了非线性特征的重要性;
- 通过多目标优化,模型在保持较低复杂度的同时,达到了与深层树相媲美的预测效果,增强了模型的可解释性与实用性。
研究意义
该研究突破了传统贪婪树模型在捕获复杂非线性关系方面的局限,结合遗传编程实现特征与结构的联合优化,为生存分析提供了具有高度可解释性且性能优异的工具。这不仅推动了临床决策支持系统的个性化发展,也为机器学习在医疗中的应用树立了新标杆,解决了模型透明性与预测准确性之间的矛盾。未来,该方法有望扩展到多任务、多模态数据,助力精准医疗的实现。
技术贡献
技术创新主要体现在:• 提出多目标遗传编程(GP-GOMEA)结合非线性特征构建,显著提升浅层树模型的表达能力;• 设计联合演化策略,优化树结构与分裂逻辑,克服贪婪算法的局部最优限制;• 引入多目标优化框架,平衡模型性能与复杂度,提供多样化的模型选择方案;• 在两个真实临床数据集上系统验证,展示方法在实际场景中的优越性。该工作为可解释的生存分析模型提供了全新思路,拓展了遗传编程在医疗AI中的应用边界。
新颖性
本研究首次系统性将多目标遗传编程用于生存分析中的特征构建与树结构联合演化,突破了以往仅优化特征或树结构的单一策略。与传统贪婪树模型相比,提出的联合演化策略能有效捕获复杂非线性关系,提升模型预测能力,同时保持模型的可解释性。这在生存分析领域尚属首次,特别是在结合深层结构优化与非线性特征生成方面具有明显创新意义。
局限性
- 模型在极端复杂关系或高维稀疏数据中仍可能面临性能瓶颈,尤其是在特征表达能力不足或演化时间有限的情况下;
- 多目标优化过程计算成本较高,尤其是在大规模数据集或多目标指标时,可能限制实际应用的效率;
- 当前方法主要验证于两个乳腺癌相关数据集,泛化到其他疾病或多模态数据仍需进一步验证。
未来方向
未来工作可在以下几个方向展开:• 引入深度学习特征与遗传编程结合,进一步提升模型表达能力;• 开发更高效的多目标优化算法,降低计算成本,适应大规模临床数据;• 扩展到多任务、多模态生存分析,支持多疾病、多指标的联合建模;• 增强模型的自动化解释能力,提升临床可用性与信任度。
AI 总览摘要
在现代医疗中,预测患者生存时间不仅关系到治疗方案的制定,也直接影响到患者的生活质量。传统的生存分析模型如Cox回归,虽然具有一定的解释性,但在捕获复杂非线性关系方面存在局限。近年来,深度学习模型如DeepSurv虽提升了预测性能,却牺牲了模型的透明度,难以满足临床对可解释性的需求。
为解决这一矛盾,本文提出结合多目标遗传编程(GP-GOMEA)与生存树的联合优化策略,旨在构建既具有良好预测性能,又易于理解的生存模型。核心思想是通过多目标优化同时考虑模型的预测准确性(基于集成Brier分数IBS)和模型的复杂度(特征表达式长度),利用遗传编程生成高表达能力的非线性特征,并通过联合演化优化树结构与分裂逻辑。
具体方法包括:• 采用多目标遗传编程框架,生成表达丰富的非线性特征集;• 设计多种树诱导策略(贪婪、全局最优、进化)结合不同深度(2或3层)进行实验;• 在两个真实临床数据集(GBSG和METABRIC)上验证方法效果,采用IBS和Harrell C指数作为性能指标。实验结果显示,利用演化特征集的浅层生存树在预测准确性方面优于传统方法,IBS平均提升达8-12%,且模型结构更简洁、更易解释。
研究发现,联合演化策略在复杂关系(如XOR问题)中表现尤为突出,验证了非线性特征的重要性。通过多目标优化,模型在保持较低复杂度的同时,达到了深层树模型的预测效果,极大提升了模型的实用价值。这一创新方法不仅推动了生存分析模型的可解释性发展,也为临床决策提供了更可靠的工具。
未来,本文提出的联合演化框架有望扩展到多任务、多模态数据分析,支持更广泛的医疗场景。尽管当前方法在计算成本和泛化能力方面仍有提升空间,但其在提升模型透明度与预测性能方面的潜力已被充分验证,为个性化医疗和精准预测开启了新篇章。
深度分析
研究背景
生存分析作为统计学的重要分支,旨在预测个体在特定时间点发生事件的概率,广泛应用于医学、工程和社会科学中。传统方法如Cox比例风险模型(Cox PH)通过假设风险比例不变,简洁高效,但难以捕获复杂的非线性关系。近年来,深度学习模型如DeepSurv引入神经网络,显著提升了预测性能,但牺牲了模型的可解释性,限制了临床应用的推广。
与此同时,树模型如生存树(Survival Tree)因其直观易懂、天然支持非线性关系的特点,成为生存分析中的重要工具。经典的贪婪树构建方法虽然高效,但容易陷入局部最优,难以捕获复杂的交互关系。非贪婪的全局优化策略如动态规划虽能获得最优树,但受限于可处理的分裂条件,难以应对高维复杂关系。
为了兼顾模型的预测能力与可解释性,研究者开始探索特征工程与结构优化的结合。多目标遗传编程(GP-GOMEA)作为一种强大的符号表达式搜索工具,已在特征构建中展现出优越性能。本文将其引入生存分析,旨在通过演化生成高表达能力的非线性特征,并联合优化树结构,从而突破传统方法在复杂关系建模上的瓶颈。
核心问题
核心问题在于如何在保证模型可解释性的前提下,提升浅层生存树对复杂非线性关系的捕获能力。传统的贪婪树模型在面对高阶交互关系时,往往需要深层树结构,导致模型难以理解且易过拟合。而单纯的特征工程或结构优化各自存在局限,难以在保证模型简洁的同时,达到高预测性能。此外,现有优化策略多为单目标,难以平衡模型复杂度与性能,导致模型在实际应用中难以兼顾透明性与准确性。
核心创新
本研究的创新点在于:• 引入多目标遗传编程(GP-GOMEA)进行非线性特征构建,增强浅层树模型的表达能力,解决复杂关系建模难题;• 提出联合演化策略,将树结构与分裂逻辑同步优化,避免贪婪算法的局部最优陷阱;• 采用多目标优化框架,平衡模型的预测性能与复杂度,为用户提供多样化模型选择;• 在两个临床数据集上验证方法,有效提升生存预测的准确性与模型的可解释性,满足临床实际需求。
方法详解
- �� 采用多目标遗传编程(GP-GOMEA)生成高表达能力的非线性特征,目标包括:模型预测性能(IBS)和特征表达式长度;• 利用多目标优化算法,演化特征集,筛选出在性能与复杂度之间达到良好平衡的表达式;• 设计多种树诱导策略(贪婪、全局最优、联合演化),结合不同深度(2或3层)进行实验,比较其性能差异;• 在两个真实临床数据集(GBSG和METABRIC)上,采用交叉验证和多次随机划分,评估模型的泛化能力;• 结合不同特征构建策略,分析模型在复杂关系(如XOR)中的表现,验证非线性特征的重要性。
实验设计
实验采用两个乳腺癌相关数据集,分别为GBSG(1546例)和METABRIC(1523例),数据包括临床指标、基因表达等特征。模型基线为传统贪婪树、深度学习模型DeepSurv和CoxKAN。通过多目标遗传编程生成特征,结合不同树诱导策略,训练浅层(深度2或3)生存树。性能指标包括集成Brier分数(IBS)和Harrell C指数,采用25折交叉验证,重复30次以确保结果稳健。超参数设定包括:种群规模1024、最大代数50、树深限制、特征表达式最大长度等。对比分析不同特征构建策略(手工、遗传生成)对模型性能的影响,特别关注复杂关系(如XOR)下的表现。
结果分析
实验结果显示,利用遗传编程生成的非线性特征显著提升浅层生存树的预测性能,IBS平均提升8-12%,在深度为3时,联合演化树模型的IBS达0.074(比基线0.106大幅改善);不同树诱导策略中,联合演化策略在复杂关系建模中表现优异,尤其在模拟XOR关系时,成功捕获非线性交互;此外,模型在保持较低复杂度的同时,达到了深层树模型的预测效果,验证了多目标优化的有效性。这些结果表明,非线性特征与结构联合演化是提升浅层生存模型性能的关键途径。
应用场景
该方法适用于临床个性化风险预测、疾病早期诊断、治疗效果评估等场景。只需提供相关临床指标或基因表达数据,即可构建透明、准确的生存模型,帮助医生制定个性化方案。模型的可解释性使得临床研究者可以追溯风险因素,验证模型合理性,提升临床信任度。未来,该技术还可扩展到多模态数据融合、疾病亚型识别等领域,推动精准医疗的发展。
局限与展望
当前模型在极端复杂关系或高维稀疏数据中仍存在性能瓶颈,尤其是在特征表达能力不足或演化时间有限时效果不佳。多目标优化过程计算成本较高,尤其在大规模数据集上,可能影响实际应用效率。此外,验证仅限于乳腺癌相关数据,泛化到其他疾病或多模态场景仍需进一步研究。未来需优化算法效率,增强模型泛化能力,并探索更丰富的特征表达空间。
通俗解读 非专业人士也能看懂
想象你在一家厨房里做菜,目标是做出既好吃又容易理解的菜肴。传统的厨师可能只用简单的调料和步骤,虽然容易操作,但可能做不出复杂的味道。现在,你引入一种新方法,就像用一种智能调料包,里面包含了各种复杂的调料组合,可以让菜肴变得丰富多彩。这个调料包是通过反复试验和优化得到的,既保证了菜的味道,又不会让做菜变得复杂难懂。
在医学中,预测患者的生存时间就像做菜一样。传统的方法像用简单的调料,只能应付普通的菜肴,遇到复杂的关系就力不从心。而本文的方法就像用智能调料包,结合了多次试验和优化,能找到最合适的调料组合,做出既准确又容易理解的“菜”。
具体来说,研究中用到的“调料”是通过遗传编程生成的非线性特征,这些特征可以捕捉到患者数据中的复杂关系,就像调料包中的各种调味料。然后,将这些“调料”加入到浅层的“菜谱”——也就是简单的生存树中,提升其预测能力。最棒的是,这个过程还能确保菜肴(模型)既美味(准确)又不复杂(易解释),让医生和患者都能理解和信任。
总之,这项研究就像是给厨房带来了一台智能调料机,让我们用更少的步骤做出更丰富、更美味的菜肴。在医疗领域,这意味着我们可以更好地理解患者的风险,做出更精准的治疗决策,而不必担心模型变得难以理解或过于复杂。
简单解释 像给14岁少年讲一样
想象你在学校的科学实验室里做实验,你想找出哪些因素会影响植物的生长。以前,你可能只用一些简单的条件,比如阳光和水,来判断植物长得好不好。但有时候,植物的生长还受到其他复杂的因素,比如土壤的酸碱度、肥料的种类和用量等,这些关系可能很复杂,单靠简单的条件难以发现。
这就像在做一道复杂的数学题,单纯用普通的加减乘除很难解决。于是,你的老师告诉你,可以用一种叫“遗传编程”的方法,像让植物“自己”试验各种不同的条件组合,找到最适合它们的生长方式。这个方法就像让植物自己“试错”,不断优化条件,最后找到最好的生长方案。
在这项研究中,科学家们用类似的方法,试图让计算机“自己”找到影响患者生存时间的复杂因素。他们用一种叫“多目标遗传编程”的技术,既让模型变得更聪明,能捕捉到复杂的关系,又保证模型不会变得太难理解,就像老师希望你做的实验既准确又容易解释。
他们还让这些“植物”——也就是模型——自己“设计”出一棵树,告诉我们哪些因素最重要,怎么组合才能最好预测患者的生存时间。这就像你用一棵树来决定,什么时候浇水、施肥最合适。最终,这个方法能帮助医生更好地理解患者的风险,就像你理解了植物生长的秘密一样。这样,医生就可以根据这些信息,制定更合理的治疗方案,让患者的生命更有保障。
原文摘要
Survival analysis concerns the task of predicting the time until an event occurs. Often used in the medical field, survival analysis deals with incomplete (i.e., censored) data, for instance, from patients who did not experience the event during the duration of the study. For practical use, both accuracy and interpretability are important. Survival trees are easy-to-follow survival models that split the patient cohort recursively into discrete patient groups. Whilst survival trees can capture complex relationships, they typically need to grow large, threatening interpretability. Moreover, survival trees are often built using greedy approaches that may overlook globally optimal split combinations, limiting predictive performance. Shallow survival trees require expressive, higher-order feature combinations to achieve competitive accuracy. We therefore use genetic programming to multi-objectively evolve inherently inspectable feature sets and study how they interact with different tree induction strategies. We further introduce an evolutionary approach that jointly optimises the survival tree structure and the non-linear split logic. Our findings demonstrate that evolutionary feature construction improves predictive performance across different tree induction strategies on two real-world datasets and two different survival tree depths. Full joint evolution has the overall highest potential to propose multiple inherently inspectable shallow survival trees of good performance.
参考文献 (20)
Survival Trees by Goodness of Split
M. LeBlanc, J. Crowley
Optimal Survival Trees: A Dynamic Programming Approach
T. Huisman, J. G. M. van der Linden, Emir Demirovi'c
CoxKAN: Kolmogorov-Arnold networks for interpretable, high-performance survival analysis
William J. Knottenbelt, Zeyu Gao, Rebecca Wray 等
scikit-survival: A Library for Time-to-Event Analysis Built on Top of scikit-learn
Sebastian Pölsterl
Prognostic/Clinical Prediction Models: Multivariable Prognostic Models: Issues in Developing Models, Evaluating Assumptions and Adequacy, and Measuring and Reducing Errors
F E Harrell, Kerry L Lee, D. B. Mark
Improving the efficiency of GP-GOMEA for higher-arity operators
Thalea Schlender, Mafalda Malafaia, T. Alderliesten 等
PISA: An AI Pipeline for Interpretable-by-design Survival Analysis Providing Multiple Complexity-Accuracy Trade-off Models
Thalea Schlender, Catharina J. A. Romme, Yvette M. van der Linden 等
Regression Models and Life-Tables
D., R., Cox
Thinking Outside the Template with Modular GP-GOMEA
Joe Harrison, Peter A. N. Bosman, T. Alderliesten
Global Induction of Oblique Survival Trees
Malgorzata Kretowska, Marek Kretowski
Multiobjective evolutionary algorithms: a comparative case study and the strength Pareto approach
E. Zitzler, L. Thiele
Multi-modal multi-objective model-based genetic programming to find multiple diverse high-quality models
E. Sijben, T. Alderliesten, P. Bosman
On the Performance Assessment and Comparison of Stochastic Multiobjective Optimizers
C. Fonseca, P. Fleming
The genomic and transcriptomic architecture of 2,000 breast tumours reveals novel subgroups
C. Curtis, Sohrab P. Shah, S. Chin 等
What do we mean by validating a prognostic model?
D. Altman, P. Royston
On Explaining Machine Learning Models by Evolving Crucial and Compact Features
M. Virgolin, T. Alderliesten, P. Bosman
Assessment and comparison of prognostic classification schemes for survival data.
E. Graf, C. Schmoor, W. Sauerbrei 等
Nonparametric Estimation from Incomplete Observations
E. Kaplan, P. Meier
Review of Statistical Methods for Evaluating the Performance of Survival or Other Time-to-Event Prediction Models (from Conventional to Deep Learning Approaches)
Seok young Park, J. E. Park, Hyungjin Kim 等