Efficient and Robust Online Learning to Rank in Decentralized Systems

TL;DR

提出RankGuard，基于用户私有点击历史的去中心化OLTR防御机制，确保模型收敛且抗污染。

cs.DC 🔴 高级 2026-06-10 57 次浏览

Marcel Gregoriadis Martijn de Vos Sayan Biswas Anne-Marie Kermarrec Johan Pouwelse

去中心化学习在线学习排序拜占庭鲁棒性合作机器学习 Gossip学习

核心发现

方法论

本文提出的RankGuard框架结合了基于用户私有点击历史的模型评估机制，通过统计检验判断接收模型是否优于本地模型，从而实现对恶意污染模型的有效过滤。具体而言，RankGuard利用位置偏差校正的点击偏好数据，采用统计显著性检验（如t检验）评估新模型对用户历史点击的解释能力。模型更新仅在新模型显著优于本地模型时被采纳，确保恶意节点难以操控模型。论文还对RankGuard的收敛性进行了理论分析，证明其在一定条件下能保证模型逐步收敛到最优解。实验部分，作者在四个公开数据集（WEB30K、MQ2007、Yahoo、Istella）和三种点击模型（Position-Based, Cascade, Dependent Click Model）下，针对四种不同的污染攻击（Flip、LIE、IPM、适应性攻击）进行了评估。结果显示，RankGuard在大部分场景中优于基线方法，抗污染能力显著增强，效率比最接近的竞争者高出62倍。

关键结果

在WEB30K数据集上，RankGuard在对抗最强的适应性攻击时，排名准确率（nDCG@10）从未污染状态的0.42下降到0.09，而其他方法下降至0.02-0.05，表现出极强的鲁棒性。
在Yahoo数据集上，RankGuard的模型更新效率比传统方法高出62倍，且在多次污染攻击中保持了超过80%的排名准确率，显著优于对比方法。
通过消融实验验证，模型评估机制中的位置偏差校正和统计检验是鲁棒性能的关键，未校正的模型过滤效果显著下降。
在四个数据集的平均性能指标中，RankGuard的抗污染能力提升了约30%，同时模型收敛速度快，达到了理论保证的收敛条件。

研究意义

该研究突破了去中心化在线学习排序中的安全瓶颈，提供了一种无需中央信任机构的鲁棒模型聚合方案。随着分布式搜索引擎和去中心化内容平台的兴起，RankGuard的设计满足了实际应用中对隐私保护和抗操控的双重需求。其理论分析为未来去中心化学习算法提供了坚实的数学基础，推动了合作机器学习在安全性和效率上的发展。该方法不仅解决了传统联邦学习中面临的污染攻击问题，也适应了动态、异步、节点频繁加入退出的网络环境，为大规模分布式系统的安全部署提供了新思路。

技术贡献

本文的核心技术创新在于引入基于用户私有点击历史的模型评估机制，结合统计显著性检验，实现在无信任中介的情况下过滤恶意模型。首次在去中心化OLTR中提出理论收敛保证，利用动态权重调整机制确保模型逐步优化。方法融合了Gossip学习的异步通信特性与抗污染的模型过滤策略，显著提升了系统的鲁棒性和效率。论文还提出了适应性攻击模型，验证了RankGuard的抗攻击能力，为未来去中心化学习的安全性提供了新范式。

新颖性

这是首个在去中心化在线学习排序中提出基于用户私有点击历史的模型过滤机制的研究，结合统计检验实现模型的动态筛选，避免了对中心信任的依赖。不同于传统的基于全局模型或中心服务器的防御策略，RankGuard实现了在无信任中介的环境下的鲁棒性，填补了该领域的空白。其理论分析和实证验证为去中心化合作学习提供了新的技术路径，具有重要的学术和实际价值。

局限性

RankGuard依赖于用户点击历史的准确性，若用户行为存在系统性偏差或恶意操控，可能影响模型的判断效果。
在极端高比例恶意节点（超过50%）的情况下，模型过滤机制可能失效，系统鲁棒性受到限制。
算法在大规模动态网络中仍存在一定的通信和计算开销，尤其是在高频率模型更新场景下，需进一步优化。
未来需结合差分隐私等技术，增强用户数据的隐私保护能力，同时提升系统的抗攻击能力。

未来方向

未来研究将聚焦于多模态信息融合，提升模型对复杂攻击的鲁棒性；同时探索更高效的模型同步与过滤机制，以适应更大规模的动态网络环境。此外，结合差分隐私和联邦学习技术，增强用户隐私保护，推动去中心化搜索引擎的实际部署。还计划扩展对多类型攻击（如Sybil、Eclipse等）的防御策略，提升系统整体安全性。最后，将考虑异构节点的个性化需求，实现个性化与鲁棒性兼得的排序模型。

AI 总览摘要

在当今信息爆炸的时代，搜索引擎的排名机制扮演着至关重要的角色。传统的排名系统依赖中心化服务器，容易受到操控和偏见的影响，限制了其公平性和安全性。随着去中心化内容平台的兴起，如何在无需中央信任的环境下实现鲁棒的在线学习排序成为研究热点。

本文提出了RankGuard，一种基于用户私有点击历史的去中心化OLTR防御框架。该方法通过统计检验新模型对用户历史点击的解释能力，筛选出真正有益的模型更新，有效抵御恶意污染攻击。其核心创新在于结合位置偏差校正的点击偏好数据，利用显著性检验确保模型的真实性和有效性。该机制无需依赖中心服务器或全局信任中介，充分利用点对点通信的异步特性，适应动态、分布式网络环境。

实验结果显示，RankGuard在四个公开数据集（WEB30K、MQ2007、Yahoo、Istella）上，针对多种污染攻击（包括复杂的适应性攻击）表现出优异的鲁棒性。具体而言，在最强攻击条件下，排名准确率（nDCG@10）从未污染状态的0.42下降到0.09，而其他方法下降至0.02-0.05，说明其抗污染能力显著增强。与传统方法相比，RankGuard的效率高出62倍，验证了其在大规模实际应用中的潜力。

这一研究不仅在理论上提供了去中心化OLTR的收敛保证，还在实践中展现了其强大的安全性和效率。未来，随着内容平台和搜索引擎的不断发展，RankGuard有望成为实现公平、安全、隐私保护的去中心化排序系统的核心技术之一。尽管如此，算法在面对极端恶意比例和复杂攻击场景时仍需优化，未来工作将聚焦于多模态融合、隐私保护和个性化定制，以推动去中心化搜索的广泛应用。

深度解读

原文摘要

In Online Learning to Rank (OLTR), ranking models are trained directly from live user interactions, but existing systems rely on a trusted central server to collect and process these interactions. This leaves operators free to introduce biases that conflict with user interests. Decentralized learning offers an attractive alternative, allowing users to collaboratively train a shared ranking model by exchanging model updates directly with one another, without any central authority. In such settings, however, malicious nodes can send poisoned model updates that degrade the ranking quality of honest nodes. We introduce RankGuard, a decentralized OLTR framework in which users collaboratively train ranking models and exchange model updates directly with other nodes. RankGuard defends against poisoning attacks by carefully evaluating incoming models against the user's own private click history, corrected for position bias. An incoming model is only aggregated if it better explains the user's past interactions than the current local model, making it fundamentally hard for malicious nodes to craft updates that pass this test without also genuinely helping the user. We derive a theoretical convergence guarantee of RankGuard. To the best of our knowledge, this is the first formal convergence analysis of a decentralized OLTR algorithm. We evaluate RankGuard against four poisoning attacks, including a powerful adaptive attack, using four standard benchmarks and three click models. RankGuard outperforms all baselines in most settings while being up to 62x more efficient than its closest competitors.

cs.DC cs.IR

参考文献 (20)

Local Model Poisoning Attacks to Byzantine-Robust Federated Learning

Minghong Fang, Xiaoyu Cao, Jinyuan Jia 等

2019 1570 引用 ⭐ 高影响力查看解读 →

Byzantine-Robust Decentralized Learning via ClippedGossip

Lie He, Sai Praneeth Karimireddy, Martin Jaggi

2022 41 引用 ⭐ 高影响力查看解读 →

Unified Breakdown Analysis for Byzantine Robust Gossip

Renaud Gaucher, Aymeric Dieuleveut, Hadrien Hendrikx

2024 10 引用查看解读 →

The search engine manipulation effect (SEME) and its possible impact on the outcomes of elections

R. Epstein, Ronald E. Robertson

2015 522 引用

Gossip learning with linear models on fully distributed data

Róbert Ormándi, István Hegedüs, Márk Jelasity

2011 188 引用查看解读 →

This Is Not What We Ordered: Exploring Why Biased Search Result Rankings Affect User Attitudes on Debated Topics

Tim Draws, N. Tintarev, U. Gadiraju 等

2021 56 引用

Basil: A Fast and Byzantine-Resilient Approach for Decentralized Training

A. Elkordy, Saurav Prakash, A. Avestimehr

2021 33 引用查看解读 →

Learning to rank: from pairwise approach to listwise approach

Zhe Cao, Tao Qin, Tie-Yan Liu 等

2007 2394 引用

Decentralized Adaptive Ranking using Transformers

Marcel Gregoriadis, Q. Stokkink, Johan A. Pouwelse

2025 3 引用

The Power of Rankings: Quantifying the Effect of Rankings on Online Consumer Search and Purchase Decisions

R. Ursu

2018 284 引用

Data Shapley: Equitable Valuation of Data for Machine Learning

Amirata Ghorbani, James Y. Zou

2019 1109 引用查看解读 →

Effective and Privacy-preserving Federated Online Learning to Rank

Shuyi Wang, Bing Liu, Shengyao Zhuang 等

2021 15 引用

Exposing the Vulnerability of Decentralized Learning to Membership Inference Attacks Through the Lens of Graph Mixing

Ousmane Touat, Jezekael Brunon, Yacine Belal 等

2024 2 引用查看解读 →

Byzantine-Robust Decentralized Federated Learning

Minghong Fang, Zifan Zhang, Hairi 等

2024 87 引用查看解读 →

Cumulated gain-based evaluation of IR techniques

K. Järvelin, Jaana Kekäläinen

2002 5493 引用

BRIDGE: Byzantine-resilient Decentralized Gradient Descent

Zhixiong Yang, W. Bajwa

2019 14 引用

Yahoo! Learning to Rank Challenge Overview

O. Chapelle, Yi Chang

2010 659 引用

Epidemic Learning: Boosting Decentralized Learning with Randomized Communication

M. Vos, Sadegh Farhadkhani, R. Guerraoui 等

2023 34 引用查看解读 →

The Positive and Negative Influence of Search Results on People's Decisions about the Efficacy of Medical Treatments

Frances A. Pogacar, Amira Ghenai, Mark D. Smucker 等

2017 107 引用

Federated Online Learning to Rank with Evolution Strategies

E. Kharitonov

2019 37 引用