CAST: Modeling Semantic-Level Transitions for Complementary-Aware Sequential Recommendation

TL;DR

CAST框架通过语义级转换建模，提升了17.6%召回率和16.0% NDCG，训练加速65倍。

cs.IR 🔴 高级 2026-04-21 31 次浏览

Qian Zhang Lech Szymanski Haibo Zhang Jeremiah D. Deng

序列推荐语义转换大语言模型向量量化补充关系

核心发现

方法论

CAST框架通过引入语义级转换模块和补充先验注入模块，解决了传统序列推荐模型中误将虚假相关性视为真实补充关系的问题。语义级转换模块直接在离散语义编码空间中建模动态转换，捕获细粒度的语义依赖。补充先验注入模块则将经过大语言模型验证的补充先验融入注意力机制，优先考虑补充模式而非共现统计。

关键结果

在多个电商数据集上，CAST相较于最先进的方法，召回率提升了17.6%，NDCG提升了16.0%，训练速度加快了65倍。这表明CAST在揭示潜在商品补充性方面的有效性和效率。
通过消融实验验证，语义级转换模块和补充先验注入模块对性能提升至关重要，去除任一模块都会导致性能显著下降。
在冷启动场景中，CAST也表现出色，能够有效捕获新用户和新商品之间的补充关系。

研究意义

CAST框架在学术界和工业界具有重要意义。它不仅解决了序列推荐中的长期痛点，即如何有效识别商品间的真实补充关系，还为基于语义的推荐系统提供了新的思路。通过引入语义级转换和补充先验注入，CAST在数据稀疏和噪声环境下表现出色，具有广泛的应用潜力。

技术贡献

CAST的技术贡献在于其创新性地结合了语义级转换和补充先验注入，突破了传统方法仅依赖共现统计的局限。通过在离散语义编码空间中建模动态转换，CAST能够捕获更细粒度的语义依赖，并通过大语言模型验证的补充先验增强模型的注意力机制。这种方法不仅提高了推荐精度，还显著加速了训练过程。

新颖性

CAST是首个在序列推荐中引入语义级转换的框架，相较于现有方法，如SASRec和FEARec，CAST能够更精确地捕获商品间的补充关系。其核心创新在于通过语义级转换和补充先验注入，超越了传统方法的统计相关性限制。

局限性

CAST在处理极其稀疏的数据集时，可能会面临语义信息不足的问题，导致推荐精度下降。
由于依赖于大语言模型的补充先验验证，CAST在计算资源有限的环境中可能不够高效。
在某些特定领域，语义级转换可能无法完全捕获商品间的复杂关系。

未来方向

未来的研究方向包括：1) 探索如何在更大规模的数据集上应用CAST，进一步验证其可扩展性；2) 研究如何在不依赖大语言模型的情况下，构建更加高效的补充先验注入机制；3) 探讨CAST在其他领域（如社交网络推荐、内容推荐）中的应用潜力。

AI 总览摘要

序列推荐系统旨在根据用户的历史行为预测其下一次交互。然而，传统方法常常依赖于稀疏的共购统计，容易将虚假相关性误认为真实的补充关系。这种误判不仅影响推荐精度，还可能导致用户体验不佳。

为了解决这一问题，Zhang等人提出了CAST框架，通过引入语义级转换模块和补充先验注入模块，重构了序列推荐的建模范式。语义级转换模块直接在离散语义编码空间中建模动态转换，捕获细粒度的语义依赖，而补充先验注入模块则将经过大语言模型验证的补充先验融入注意力机制，优先考虑补充模式而非共现统计。

CAST的核心技术原理在于其对语义级转换的创新应用。通过在离散语义编码空间中建模，CAST能够有效捕获商品间的细粒度语义依赖，超越了传统方法的统计相关性限制。此外，补充先验注入模块通过大语言模型验证的补充先验，进一步增强了模型的注意力机制。

实验结果表明，CAST在多个电商数据集上表现出色，召回率提升了17.6%，NDCG提升了16.0%，训练速度加快了65倍。这不仅验证了CAST的有效性和效率，也展示了其在冷启动场景中的潜力。

CAST框架的广泛应用潜力在于其能够在数据稀疏和噪声环境下，准确识别商品间的补充关系。这为基于语义的推荐系统提供了新的思路，具有重要的学术和工业意义。

然而，CAST也存在一些局限性，如在极其稀疏的数据集上可能面临语义信息不足的问题，以及在计算资源有限的环境中可能不够高效。未来的研究方向包括探索CAST在更大规模数据集上的应用，以及在不依赖大语言模型的情况下，构建更加高效的补充先验注入机制。

深度分析

研究背景

序列推荐系统旨在通过建模用户的历史行为序列，预测其下一次可能的交互。传统的序列推荐方法，如SASRec和FEARec，通常依赖于共购统计数据，这些数据虽然能够提供一定的推荐依据，但往往因数据稀疏和噪声而导致推荐精度下降。近年来，语义感知方法逐渐兴起，通过利用离散语义编码来捕获商品的文本信息。然而，这些方法通常将语义编码聚合为粗粒度的商品表示，无法有效捕获商品间的细粒度语义依赖，限制了其在识别补充关系方面的能力。

核心问题

传统序列推荐系统面临的核心问题在于如何有效识别商品间的真实补充关系。由于共购统计数据的稀疏性和噪声，传统方法容易将虚假相关性误认为真实的补充关系。此外，现有的语义感知方法在聚合语义编码时，往往丢失了识别补充关系所需的具体语义细节。这些问题不仅影响推荐精度，还可能导致用户体验不佳。

核心创新

CAST框架的核心创新在于：1) 引入语义级转换模块，直接在离散语义编码空间中建模动态转换，捕获细粒度的语义依赖；2) 通过补充先验注入模块，将经过大语言模型验证的补充先验融入注意力机制，优先考虑补充模式而非共现统计；3) 结合语义级转换和补充先验注入，突破了传统方法仅依赖共现统计的局限，显著提升了推荐精度和训练效率。

方法详解

�� 语义级转换模块：在离散语义编码空间中建模动态转换，捕获细粒度的语义依赖。
�� 补充先验注入模块：将经过大语言模型验证的补充先验融入注意力机制。
�� 语义编码：通过预训练语言模型编码商品文本特征，并离散化为共享语义码本。
�� 自注意力机制：结合补充先验，调整注意力分布，优先考虑补充模式。

实验设计

实验在多个电商数据集上进行，采用的基线方法包括SASRec、FEARec等。评估指标为召回率和NDCG。实验设计包括消融实验，验证各模块对模型性能的影响。关键超参数包括语义编码的码本大小和补充先验的权重。

结果分析

实验结果表明，CAST在多个电商数据集上表现出色，召回率提升了17.6%，NDCG提升了16.0%，训练速度加快了65倍。消融实验验证了语义级转换模块和补充先验注入模块对性能提升至关重要。CAST在冷启动场景中也表现出色，能够有效捕获新用户和新商品之间的补充关系。

应用场景

CAST框架可广泛应用于电商推荐系统，特别是在数据稀疏和噪声环境下。其能够准确识别商品间的补充关系，提升推荐精度和用户满意度。此外，CAST在冷启动场景中表现出色，适用于新用户和新商品的推荐。

局限与展望

CAST在处理极其稀疏的数据集时，可能会面临语义信息不足的问题，导致推荐精度下降。由于依赖于大语言模型的补充先验验证，CAST在计算资源有限的环境中可能不够高效。在某些特定领域，语义级转换可能无法完全捕获商品间的复杂关系。未来研究方向包括探索CAST在更大规模数据集上的应用，以及在不依赖大语言模型的情况下，构建更加高效的补充先验注入机制。

通俗解读非专业人士也能看懂

想象一下你在一个巨大的超市购物，超市里有成千上万的商品。你想买一台新相机，但你不知道该买哪个型号。传统的推荐系统就像一个只根据其他顾客的购买记录来推荐商品的店员。他可能会建议你买一台热门的相机，但这并不一定是最适合你的选择。

而CAST就像一个聪明的店员，他不仅了解每台相机的技术规格，还知道哪些相机和配件是最佳搭配。他会根据你的需求，推荐一台不仅受欢迎而且功能上与你的其他设备完美互补的相机。

CAST通过分析商品的细节信息，而不是仅仅依赖于其他顾客的购买记录，来做出更明智的推荐。这就像是店员在推荐商品时，不仅考虑到商品的销量，还考虑到商品的功能和你个人的需求。

因此，CAST能够在数据稀疏和噪声较大的环境下，提供更准确的推荐，提升你的购物体验。

简单解释像给14岁少年讲一样

嘿，小伙伴！你知道吗，网上购物的时候，网站会根据你之前买过的东西，推荐你可能会喜欢的新商品。这就像你在游戏里打怪升级，系统会根据你的装备和技能，推荐你去打哪些怪。

不过，有时候这些推荐并不准确，因为系统只看到了你买过什么，而不知道你真正需要什么。就像在游戏里，系统可能会推荐你去打一个很强的怪，但其实你需要的是一个能提升你技能的装备。

CAST就像是一个聪明的游戏助手，他不仅知道你之前买过什么，还能分析每个商品的细节，找到那些和你现有装备最搭配的商品。这样一来，你就能更快地升级，打败更强的怪！

所以，CAST不仅能帮你找到你喜欢的商品，还能让你的购物体验更棒，就像在游戏里找到了一件完美的装备一样！

术语表

序列推荐 (Sequential Recommendation)

一种预测用户下一次交互的推荐方法，基于用户的历史行为序列。

在论文中用于预测用户的下一个购买行为。

补充关系 (Complementary Relations)

指商品之间的功能性互补关系，能够提升用户体验。

用于识别商品间的真实补充关系，而非仅仅依赖共现统计。

语义级转换 (Semantic-Level Transition)

在离散语义编码空间中建模动态转换，捕获细粒度的语义依赖。

用于解决传统方法中语义细节丢失的问题。

大语言模型 (Large Language Model)

一种基于深度学习的语言模型，能够理解和生成自然语言。

用于验证补充先验，增强注意力机制。

向量量化 (Vector Quantization)

一种将连续数据离散化为有限集合的技术，用于语义编码。

用于将商品的文本特征编码为离散语义码。

注意力机制 (Attention Mechanism)

一种在深度学习中用于选择性关注输入信息的技术。

用于结合补充先验，调整注意力分布。

消融实验 (Ablation Study)

通过去除模型的某些部分来评估其对整体性能的影响。

用于验证各模块对CAST性能的贡献。

冷启动 (Cold Start)

推荐系统在新用户或新商品缺乏历史数据时面临的挑战。

CAST在冷启动场景中表现出色。

共现统计 (Co-occurrence Statistics)

基于商品共同出现频率的统计数据，用于推荐系统。

传统方法依赖于共现统计，容易误判补充关系。

召回率 (Recall)

衡量推荐系统在所有相关商品中成功推荐的比例。

用于评估CAST的推荐性能。

开放问题这项研究留下的未解疑问

1 如何在不依赖大语言模型的情况下，构建更加高效的补充先验注入机制？目前的方法依赖于大语言模型进行补充先验验证，这在计算资源有限的环境中可能不够高效。未来的研究可以探索更轻量级的验证方法。
2 CAST在极其稀疏的数据集上表现如何？虽然CAST在多个电商数据集上表现出色，但在极其稀疏的数据集上，语义信息不足可能导致推荐精度下降。需要进一步研究其在此类场景中的表现。
3 如何在更大规模的数据集上应用CAST？目前的实验在相对较小的数据集上进行，未来需要验证CAST在更大规模数据集上的可扩展性和性能。
4 CAST在其他领域（如社交网络推荐、内容推荐）中的应用潜力如何？虽然CAST在电商推荐中表现出色，但其在其他领域中的应用潜力仍需进一步探索。
5 如何进一步提升CAST在冷启动场景中的表现？虽然CAST在冷启动场景中表现良好，但仍需研究如何进一步提升其对新用户和新商品的推荐精度。

应用场景

近期应用

电商推荐系统

CAST可用于电商平台，提升推荐精度和用户满意度，特别是在数据稀疏和噪声环境下。

新用户推荐

在冷启动场景中，CAST能够有效捕获新用户和新商品之间的补充关系，提升推荐效果。

个性化推荐

通过分析商品的细节信息，CAST能够提供更个性化的推荐，满足用户的特定需求。

远期愿景

跨领域推荐

探索CAST在社交网络推荐、内容推荐等其他领域中的应用潜力，扩展其应用范围。

智能购物助手

结合语义级转换和补充先验注入，开发智能购物助手，提供更智能的购物建议。

原文摘要

Sequential Recommendation (SR) aims to predict the next interaction of a user based on their behavior sequence, where complementary relations often provide essential signals for predicting the next item. However, mainstream models relying on sparse co-purchase statistics often mistake spurious correlations (e.g., due to popularity bias) for true complementary relations. Identifying true complementary relations requires capturing the fine-grained item semantics (e.g., specifications) that simple cooccurrence statistics would be unable to model. While recent semantics-based methods utilize discrete semantic codes to represent items, they typically aggregate semantic codes into coarse item representations. This aggregation process blurs specific semantic details required to identify complementarity. To address these critical limitations and effectively leverage semantics for capturing reliable complementary relations, we propose a Complementary-Aware Semantic Transition (CAST) framework that introduces a new modeling paradigm built upon semantic-level transitions. Specifically, a semantic-level transition module is designed to model dynamic transitions directly in the discrete semantic code space, effectively capturing fine-grained semantic dependencies often lost in aggregated item representations. Then, a complementary prior injection module is designed to incorporate LLM-verified complementary priors into the attention mechanism, thereby prioritizing complementary patterns over co-occurrence statistics. Experiments on multiple e-commerce datasets demonstrate that CAST consistently outperforms the state-of-the-art approaches, achieving up to 17.6% Recall and 16.0% NDCG gains with 65x training acceleration. This validates its effectiveness and efficiency in uncovering latent item complementarity beyond statistics. The code will be released upon acceptance.

cs.IR cs.LG

参考文献 (20)

Frequency Enhanced Hybrid Attention Network for Sequential Recommendation

Xinyu Du, Huanhuan Yuan, Pengpeng Zhao 等

2023 169 引用 ⭐ 高影响力查看解读 →

Self-Attentive Sequential Recommendation

Wang-Cheng Kang, Julian McAuley

2018 3528 引用 ⭐ 高影响力查看解读 →

Learning Vector-Quantized Item Representation for Transferable Sequential Recommenders

Yupeng Hou, Zhankui He, Julian McAuley 等

2022 245 引用 ⭐ 高影响力查看解读 →

Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Colin Raffel, Noam Shazeer, Adam Roberts 等

2019 25256 引用查看解读 →

Sequential Recommendation with Graph Neural Networks

Jianxin Chang, Chen Gao, Y. Zheng 等

2021 459 引用查看解读 →

Recommendations as Treatments: Debiasing Learning and Evaluation

Tobias Schnabel, Adith Swaminathan, Ashudeep Singh 等

2016 794 引用查看解读 →

Optimized Product Quantization

T. Ge, Kaiming He, Qifa Ke 等

2014 474 引用

Causal Intervention for Leveraging Popularity Bias in Recommendation

Yang Zhang, Fuli Feng, Xiangnan He 等

2021 500 引用查看解读 →

Semantic Relation Guided Dual-view Contrastive Learning for Session-based Recommendations

Qian Zhang, Shoujin Wang, Longbing Cao 等

2025 5 引用

Sequence-level Semantic Representation Fusion for Recommender Systems

Lanling Xu, Zhen Tian, Bingqian Li 等

2024 30 引用查看解读 →

Make It a Chorus: Knowledge- and Time-aware Item Modeling for Sequential Recommendation

Chenyang Wang, Min Zhang, Weizhi Ma 等

2020 159 引用

A Simple Framework for Contrastive Learning of Visual Representations

Ting Chen, Simon Kornblith, Mohammad Norouzi 等

2020 23811 引用查看解读 →

Sparse-Interest Network for Sequential Recommendation

Qiaoyu Tan, Jianwei Zhang, Jiangchao Yao 等

2021 168 引用查看解读 →

Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding

Jiaxi Tang, Ke Wang

2018 2135 引用查看解读 →

Contrastive Learning for Representation Degeneration Problem in Sequential Recommendation

Ruihong Qiu, Zi Huang, Hongzhi Yin 等

2021 519 引用查看解读 →

BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer

Fei Sun, Jun Liu, Jian Wu 等

2019 3039 引用查看解读 →

Is It Really Complementary? Revisiting Behavior-based Labels for Complementary Recommendation

Kai Sugahara, Chihiro Yamasaki, Kazushi Okamoto

2024 8 引用

Is Contrastive Learning Necessary? A Study of Data Augmentation vs Contrastive Learning in Sequential Recommendation

Peilin Zhou, You-Liang Huang, Yueqi Xie 等

2024 35 引用查看解读 →

LLMRec: Large Language Models with Graph Augmentation for Recommendation

Wei Wei, Xubin Ren, Jiabin Tang 等

2023 404 引用查看解读 →

Factorizing personalized Markov chains for next-basket recommendation

Steffen Rendle, Christoph Freudenthaler, L. Schmidt-Thieme

2010 2754 引用

CAST: Modeling Semantic-Level Transitions for Complementary-Aware Sequential Recommendation

核心发现

方法论

关键结果

研究意义

技术贡献

新颖性

局限性

未来方向

AI 总览摘要

深度分析

研究背景

核心问题

核心创新

方法详解

实验设计

结果分析

应用场景

局限与展望

通俗解读 非专业人士也能看懂

简单解释 像给14岁少年讲一样

术语表

序列推荐 (Sequential Recommendation)

补充关系 (Complementary Relations)

语义级转换 (Semantic-Level Transition)

大语言模型 (Large Language Model)

向量量化 (Vector Quantization)

注意力机制 (Attention Mechanism)

消融实验 (Ablation Study)

冷启动 (Cold Start)

共现统计 (Co-occurrence Statistics)

召回率 (Recall)

开放问题 这项研究留下的未解疑问

应用场景

近期应用

电商推荐系统

新用户推荐

个性化推荐

远期愿景

跨领域推荐

智能购物助手

原文摘要

参考文献 (20)

相关论文

Aligning Dense Retrievers with LLM Utility via DistillationAligning Dense Retrievers with LLM Utility via Distillation

Can QPP Choose the Right Query Variant? Evaluating Query Variant Selection for RAG Pipelines

Objective Shaping with Hard Negatives: Windowed Partial AUC Optimization for RL-based LLM Recommenders

Rethinking Semantic Collaborative Integration: Why Alignment Is Not Enough

ResRank: Unifying Retrieval and Listwise Reranking via End-to-End Joint Training with Residual Passage Compression

ECLASS-Augmented Semantic Product Search for Electronic Components

通俗解读非专业人士也能看懂

简单解释像给14岁少年讲一样

开放问题这项研究留下的未解疑问