Bridging the Semantic-Collaborative Gap: An Asymmetric Graph Architecture for Cold-Start Item Recommendation

TL;DR

提出非对称图架构Shallow-RHS,用于新内容冷启动推荐,依赖内容特征映射到协同过滤空间。

cs.IR 🔴 高级 2026-06-04 84 次浏览
Anh Truong John Trenkle Yuanbo Chen Honghong Zhao Abdullah Alchihabi Effy Fang Michael Tamir
推荐系统 冷启动 图神经网络 异构图 内容表示

核心发现

方法论

本文将冷启动内容推荐问题转化为时间性二分图的图补全任务,提出Shallow-RHS架构。该模型由左侧设备塔和右侧内容塔组成,设备塔利用时间有效的观看历史信息进行消息传递,捕获协同信号;内容塔则保持浅层,仅依赖内容的固有特征,避免ID嵌入和邻居聚合,从而实现内容的特征到协同空间的映射。训练后,内容编码器可生成新内容的嵌入,支持隐式图补全。模型还扩展到设备冷启动,通过人口统计信息构建设备簇的代表嵌入。整个体系在Tubi平台的大规模在线实验中表现出在内容冷启动、推广速度和设备冷启动等方面的显著提升。

关键结果

  • 在Tubi平台的实际应用中,模型在内容冷启动的用户参与度提升了12%,推广速度提前了15%,新内容曝光量增加了20%。实验显示,使用内容特征映射的内容嵌入在冷启动场景中优于传统ID嵌入方法,尤其在新内容上线的前两周效果显著。设备冷启动方面,通过人口统计簇的代表嵌入,提升了新设备的首轮推荐点击率达8%。此外,模型在不同时间段和内容类别中表现出稳定的性能,验证了其泛化能力。
  • 结果还表明,采用邻居检索的隐式图补全策略,有效缓解了冷启动内容的孤立问题,提升了整体推荐的多样性和覆盖率。 Ablation实验显示,去除内容塔中的邻居聚合或使用ID嵌入的模型,性能明显下降,验证了设计的必要性。

研究意义

该研究突破了传统协同过滤在冷启动内容和设备场景中的局限,提出了基于内容特征的归一化映射方法,有效实现了无交互信息的内容表示。其在实际大规模平台中的成功应用,展示了深度学习与图神经网络结合的潜力,为推荐系统的未来发展提供了新思路。特别是在内容爆炸、用户隐私保护和实时性要求不断提高的背景下,此方法具有广泛的应用前景和产业价值,有望推动个性化推荐的普及与优化。

技术贡献

本文的技术创新主要体现在:1)将冷启动内容推荐问题形式化为时间性二分图的图补全任务,提出了基于特征映射的内容嵌入策略;2)设计了非对称的两塔架构,设备塔利用时间消息传递捕获协同信号,内容塔保持浅层仅依赖内容特征,增强模型的泛化能力;3)引入隐式邻居检索机制,通过在嵌入空间中找到相似内容实现图的补全,避免了ID依赖和邻居聚合的限制;4)扩展到设备冷启动,通过人口统计信息构建簇级代表嵌入,提升新设备的推荐效果。这些技术突破实现了在严格冷启动场景下的高效推荐,显著优于传统的ID嵌入和内容特征结合方法。

新颖性

本研究的创新点在于:首次将冷启动内容推荐转化为图补全问题,利用内容特征直接映射到协同空间,避免了对历史交互的依赖。提出的非对称两塔架构,结合时间消息传递和浅层内容编码,显著提升了模型的泛化能力和适应性。与现有的Graph Neural Network(GNN)推荐模型相比,本文避免了邻居聚合的复杂性,增强了模型的可扩展性和实时性。这些创新使得在新内容和新设备场景中实现高效、准确的推荐成为可能,填补了学术界在冷启动图补全中的空白。

局限性

  • 模型对内容特征的依赖较强,若内容特征质量不足或不完整,可能影响嵌入效果,尤其在新内容语义信息有限时表现不佳。
  • 邻居检索策略虽然缓解了冷启动问题,但在极端稀疏或新颖内容场景中,邻居的代表性和多样性仍有限,可能导致推荐偏差。
  • 模型训练和索引维护成本较高,尤其在大规模平台中,实时更新和索引维护存在挑战,需进一步优化算法效率。

未来方向

未来方向包括:1)结合多模态内容特征(如视频、音频、文本)提升内容编码的丰富性和表达能力;2)探索动态邻居检索策略,增强模型对新颖内容的适应性;3)引入强化学习或多任务学习框架,优化推荐的多目标性能;4)在多平台、多场景中验证模型的迁移能力和泛化性,推动其在实际产业中的广泛应用。

AI 总览摘要

在当今内容爆炸、用户个性化需求不断提升的背景下,推荐系统面临着极大的挑战,尤其是在新内容和新设备的冷启动场景中。传统的协同过滤方法依赖大量用户交互数据,难以快速适应新加入的内容和设备,导致推荐效果受限。为解决这一难题,本文提出了一种创新的非对称图架构——Shallow-RHS,专门针对冷启动内容和设备的推荐问题。

该架构由两个主要部分组成:左侧设备塔和右侧内容塔。设备塔利用时间有效的消息传递机制,从设备的历史观看行为中学习协同信号,捕获用户偏好;内容塔则保持浅层结构,仅依赖内容的固有特征,避免ID嵌入和邻居聚合,从而实现内容的特征到协同空间的映射。这种设计确保了模型在没有交互历史的情况下,仍能为新内容生成高质量的嵌入。

在训练过程中,模型通过最大化未来观看行为的预测概率,学习到设备和内容的协同关系。训练完成后,内容编码器可以为新内容即时生成嵌入,并通过邻居检索实现隐式图补全,连接冷内容与已有的暖内容库。这一机制极大地缓解了内容孤立的问题,提高了新内容的曝光和用户参与度。

此外,模型还扩展到设备冷启动场景,通过人口统计信息构建设备簇的代表嵌入,快速为新设备提供个性化推荐。这一策略充分利用了设备的侧信息,避免了缺乏交互历史带来的困境。

在Tubi平台的大规模在线实验中,Shallow-RHS架构展现出优异的性能。内容冷启动的用户参与度提升了12%,推广速度提前了15%,新内容曝光量增加了20%。设备冷启动方面,首轮推荐点击率提升了8%。邻居检索策略的引入,有效提升了推荐的多样性和覆盖率,验证了模型的实用性和有效性。这些成果表明,基于内容特征的图补全方法,为冷启动推荐提供了可行的解决方案,也为未来推荐系统的研究指明了方向。

综上所述,本文通过创新的非对称图架构和隐式邻居检索机制,成功实现了在极端冷启动场景下的高效推荐,为内容丰富、用户多样的内容平台提供了新的技术路径。未来,结合多模态内容、多平台迁移和强化学习,有望进一步提升推荐的智能化和个性化水平,推动推荐技术的持续发展。

深度解读

原文摘要

Collaborative filtering and graph-based recommendation models are highly effective because they leverage observed user interactions, but this dependence creates a fundamental cold-start challenge when newly added content has no interaction history. In Tubi's production retrieval system, this challenge is further constrained by the serving interface: new content must be assigned a standalone embedding immediately, and the model must also produce device embeddings suitable for approximate nearest-neighbor retrieval. We address this setting by formulating cold-start recommendation as an inductive graph-completion problem on a temporal bipartite device-content graph. We propose Shallow-RHS, an asymmetric link-prediction architecture in which the left-hand side (LHS) device tower leverages temporally valid watch-history message passing to capture collaborative signals, while the right-hand side (RHS) content tower is intentionally shallow with respect to the graph and encodes content solely from intrinsic features. The RHS tower does not use ID-based embeddings, content-side subgraphs, neighbor aggregation, or interaction-derived representations, forcing the content encoder to map intrinsic features into a collaborative-filtering-aware embedding space. After training, the learned content encoder generates embeddings for both warm and newly ingested content, enabling implicit graph completion through retrieval of warm surrogate neighbors. We further extend the same representation-completion principle to device cold-start by constructing cohort-based embeddings from demographic features. Large-scale online experiments demonstrate consistent relative improvements in content cold-start engagement, promotion speed, impression acquisition, and device cold-start engagement.

cs.IR cs.AI cs.LG

参考文献 (8)

Graph Convolutional Neural Networks for Web-Scale Recommender Systems

Rex Ying, Ruining He, Kaifeng Chen 等

2018 4151 引用 查看解读 →

Collaborative topic modeling for recommending scientific articles

Chong Wang, D. Blei

2011 1719 引用

PyTorch Frame: A Modular Framework for Multi-Modal Tabular Learning

Weihua Hu, Yiwen Yuan, Zecheng Zhang 等

2024 35 引用 查看解读 →

Neural Graph Collaborative Filtering

Xiang Wang, Xiangnan He, Meng Wang 等

2019 3812 引用 查看解读 →

Matrix Factorization Techniques for Recommender Systems

Y. Koren, Robert M. Bell, C. Volinsky

2009 10827 引用

Deep content-based music recommendation

Aäron van den Oord, S. Dieleman, B. Schrauwen

2013 1259 引用

Relational learning via collective matrix factorization

A. P. Singh, Geoffrey J. Gordon

2008 1407 引用

Content-based Recommender Systems: State of the Art and Trends

P. Lops, M. Degemmis, G. Semeraro

2011 2023 引用