MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

TL;DR

MOSS系统通过源码层自我改写，在OpenClaw上单轮演化将四任务平均评分从0.25提升至0.61。

cs.AI 🔴 高级 2026-05-22 593 次浏览

Qianshu Cai Yonggang Zhang Xianzhang Jia Wei Xue Jun Song Xinmei Tian Yike Guo

自主智能体源码改写自我演化生产级系统容器热替换

核心发现

方法论

本文提出MOSS，一种在生产级自主智能体系统上实现源码级自我改写的系统。MOSS通过自动收集用户会话中的失败实例，构建定向的故障批次，并按照严格的七阶段流水线——包括定位缺陷、制定修复计划、代码实现、代码审查、任务评估及判定——反复迭代优化。代码改写由插件式外部编程代理CLI完成，主流程负责阶段调度和决策。候选修复通过在独立试验容器中回放失败批次验证，合格后经用户同意以无缝容器热替换方式发布，且支持基于健康检测的自动回滚保障系统稳定。

关键结果

MOSS在OpenClaw系统上利用claweval数据集四个运维合规任务进行评估，初始平均grader评分仅0.25，迭代结束后该评分提升至0.61，表明系统可在无人工干预条件下解决复杂多工具调度和执行链任务瓶颈。
实验展示，源码层改写解决了以往仅能更新文本可变工件（技能文件、Prompt、内存结构、流程图）无法触及的模块调度错误、钩子顺序和状态不变式违规等结构性缺陷，大幅降低重复故障率。
多轮迭代和分阶段流水线设计实现了逐步诊断和修复，避免全局随机修改，保证修复质量和稳定性；编码代理CLI支持多模型（Claude Code, OpenAI Codex等）插件接入，灵活适配算力与服务。
通过试验工人容器的生产级环境回放失败案例，实现了真实场景下准确验证改写有效性，安全保障通过用户授权触发容器替换，并辅以90秒健康探测多维检查保证系统无缝升级。

研究意义

本研究突破了当前自适应智能体局限，将自动演化从文本可变配置扩展至源码层，显著提升智能体系统的自修复能力和结构改造范畴。解决了长期困扰生产环境中多管道调度、状态管理、执行原子性等复杂缺陷修复的难题，降低人为维护成本，提高系统鲁棒性和持续运营能力。为智能体演化领域开辟了代码层面自动改写与动态部署的先例，兼顾理论完备性与工程实用性，推动智能体自主学习体系建设。

技术贡献

技术上，MOSS首次在生产级多模块智能体系统中实现了端到端源码层自我改写链路。它提出了基于现实用户失败批次的定向演化闭环，避免了传统基准驱动探索方法的盲目随机。通过独立容器隔离试验和用户授权切换确保生产稳定，还实现了可插拔编码代理支持多种大模型服务。源码编辑作为Turing完备的自适应介质，突破了以往仅能修改技能和Prompt的限制，确立了新的演化激励和验证范式。

新颖性

MOSS开创性地将自我演化作用域扩展至智能体源码层，而非仅停留在可编辑文本工件，如Prompt和技能配置。这种源码级改写引入了确定性生效机制及不受上下文漂移影响的长效行为修正，首次实现了生产环境中复杂多模块路径和状态机的不变性保障，为自主智能体系统可持续发展奠定了基础。

局限性

目前MOSS自我演化依赖于自动采集的失败样本，若采样不足或反馈信号不准确，修复方向可能偏离实际问题，影响修复效果。
源码层改写的复杂度和潜在风险较高，尽管采用多轮校验和回滚机制，仍存在因代码更改引发新缺陷的可能，需更完善的预判和测试体系支持。
该方法在多节点/分布式智能体体系下的适用性尚需验证，目前主要针对单实例容器部署场景，跨节点状态同步和升级挑战未覆盖。

未来方向

未来工作包括扩展自动失败样本识别和质量评估算法，提升演化触发的精准度；结合更加智能的代码分析和修正建议模型，提高修复代码质量；探索多实例分布式智能体系统下的协同源码改写与状态一致性维护；并改善用户交互体验，实现更加自动化且安全的演化闭环。

AI 总览摘要

当前应用级自主智能体系统（如OpenClaw）在部署后基本保持静态，难以自适应用户反馈和实际运行表现，导致重复失败未能及时修复。以往研究虽提出自我演化机制，但限于修改文本可变配置文件（技能、提示、内存模式、流程图），无法触及智能体的核心源码层。这限制了对复杂结构性故障的修复能力，诸如消息路由错误、钩子顺序混乱及状态不一致错误无法消除。

本文提出MOSS系统，突破传统限制，实现基于生产环境的智能体源码级自我改写。其核心创新在于将演化锚定于自动采集的真实失败证据，采用多阶段确定性流水线执行：从问题定位、故障规划、代码实现，到代码复核、任务评估及最终判定。源码改写操作由外部可插拔的编程代理CLI完成，主流程负责控制阶段顺序及迭代决策。候选方案通过独立运行的试验容器回放失败批次验证，只有在用户明确同意后，才会通过容器热替换机制无缝上线，且附带健康探针保障自动回滚。

MOSS在OpenClaw的claweval四任务套件上进行案例研究。初始平均得分仅0.25，经单轮全面自我演化后提升至0.61，显著改善了执行工具链间调度、结果聚合及状态一致性等核心缺陷，表现出强大的自动修复能力。通过源码层控制，改写具备图灵完备的表达能力，支持对引擎调度、钩子逻辑和状态管理等底层核心代码的修改，远超文本层的局限。

技术实现方面，MOSS采用宿主守护进程监控容器生命周期，配合基于Unix socket及HTTP的命令与回调机制，实现了灵活高效的迭代演进管线。多轮分阶段设计令诊断与修复更精细、连贯，且通过多模型编码代理支持多种编程AI服务，提升适配弹性。最终的软件热替换机制保证用户会话和状态无缝迁移。

本研究为智能体系统提供了“开源”自我演化的范式升级，将自动化修复和持续进化能力提升到核心源码层，实现在生产环境中安全、有效的自主演化。此举极大降低维护成本，提升系统鲁棒性，对智能体长期自主运行具有里程碑意义。未来，结合多实例分布式部署及更智能的失败检测，MOSS框架将进一步拓展应用场景和自适应能力。

深度分析

研究背景

近年来，随着人工智能和自然语言处理技术的快速发展，应用级自主智能体系统逐渐进入实际生产环境，如OpenClaw便支持多渠道、多技能的复杂多步骤任务执行。学术界则探索了诸如Hermes Agent、SkillClaw等多种自我演化智能体，聚焦于通过修改技能文件、提示配置和内存结构等文本可变工件，实现一定程度上的自主修正和优化。部分研究如SICA、Darwin Gödel Machine则尝试了源代码级演化，展示了代码重写能够在理论上带来更强的自适应能力。

然而，生产级系统代码规模庞大且复杂，包含路由、钩子顺序、状态机不变式以及多模块调度机制，以上架构层面的缺陷无法单靠修改文本工件解决，导致某些失败无法根治。这就形成了文本层与源码层两个不同的演化介质，后者是前者的更广义和图灵完备超集，能够实现确定性、长效的行为修改。MOSS系统正是在此背景下应运而生，旨在将学术上的源码自我演化转化为生产环境可用的工程方案。

核心问题

目前自主智能体的自我演化大多局限于文本可变工件的层面，无法触及智能体核心代码，包括消息路由、钩子触发顺序、状态不变式及多技能调度等底层机制。而这正是产生结构性失败的关键层面，导致相似问题反复出现。生产环境中，缺乏有效自动化手段对源码层进行安全灵活的自我改写，造成更新依赖人工干预，降低演化效率和响应速度。此外，现有以基准测试驱动的探索式演化方法难以适应大规模复杂代码库，且无法精准针对用户反馈的具体问题进行定向修正，存在试错成本高、回归风险大等障碍。

核心创新

MOSS系统的核心创新体现在以下几个方面：

1. 定向定量演化目标：通过周期自动扫描用户会话日志及用户标记，构建真实失败批次，使演化锚定于具体用户反馈和失败案例，而非抽象基准指标。

2. 七阶段细粒度流水线：包括缺陷定位（Locate）、初步规划（Plan）、规划审核（Plan-Review）、代码实现（Implement）、代码审查（Code-Review）、任务评价（Task-Evaluate）和判决（Verdict），每阶段聚焦特定任务，支持多轮循环以提高修复质量。

3. 可插拔外部编码代理CLI：将代码改写职责外包给多种大型语言模型服务（如Claude Code、OpenAI Codex），实现多模型灵活切换，提升改写的适应性和创新性。

4. 生产级试验环境验证：通过构建隔离的临时容器，回放失败批次验证候选代码修复性能，保障改写效果和回归风险最小化。

5. 无缝热替换部署机制：结合用户确认策略和健康探针，实施容器级别的在线替换与回滚，支持用户状态持久化，保证上线安全与服务连续。

方法详解

MOSS系统具有以下关键步骤和组件：

�� 失败证据采集：周期自动扫描OpenClaw用户会话JSONL日志，结合用户标记功能（moss evo flag），提取含弱表现或缺失的对话片段构成待修复故障批次。

�� 演化触发与批次管理：通过moss evo start CLI指令触发演化，选择最新未处理故障批次执行序列。

�� 多轮七阶段流水线：（1）Locateステージ：分析故障批次，锁定源码缺陷点；（2）Plan阶段：根据定位制定修复计划；（3）Plan-Review阶段循环确认计划合理性；（4）Implement实现代码改写；（5）Code-Review循环确保代码质量；（6）Task-Evaluate对修复效果进行语义评分评估；（7）Verdict判定是否满足终止条件或继续迭代。

�� 外部编码代理CLI调用：每阶段任务执行时，系统调用基于大型语言模型的插件CLI（支持Claude Code, OpenAI Codex等）完成代码定位、规划、改写和审查，分离决策和执行。

�� 试验容器验证：主机守护程序启动N个临时容器，从候选镜像运行失败批次任务，保证评估环境贴合实际生产容器配置。

�� 容器热替换部署：用户同意后，通过守护进程感知替换请求，启动候选镜像替换运行中主容器，执行健康探针检测连续通过后确认上线，不合格自动回滚，用户状态通过持久挂载卷持续保留。

实验设计

本研究以OpenClaw智能体系统为平台，选取claweval数据集中四个运维合规任务（包括SLA遵守审核和补货链路检测，中英文版本各两组）作为失败示例批次。基线模型为DeepSeek V3.2语言模型，初始任务平均评分约0.25（低于0.75及格线），展现多任务间调度与数据链路解析不完整等陷阱。演化循环在单次迭代内完成全流水线，执行源码问题定位、代码重写、代码审查和运行时验证。多个大型语言模型编码代理协同调用，实现灵活准确的代码修正。最终候选版本在独立试验容器中反复验证失败批次，保证修后质量。部署过程中，用户采用对话命令触发应用，新镜像通过容器热替换与健康检测无缝上线。

结果分析

MOSS系统成功将初始低至0.25的平均分提升至0.61，表明源码级修正有效关闭了多任务工具链调用和状态传递的缺陷缺口。实验中，通过定位Harness层内多实体合并输出未被标注导致的信息缺失问题，新增注解分支提示及调用拒绝门控，修正了调度和数据合并缺陷。多周期的计划与代码审核循环减少了误修复的风险。Runtime trial workers确保代码改写在生产等同环境中的正确性，并防止潜在竞态和状态不一致引起的新异常。整个过程无需人工介入即可完成实质性能提升，验证了系统自动演化的工程可行性。

应用场景

MOSS主要适用于多技能多任务的生产级自主智能体平台，尤其是具备复杂模块调度、状态生命周期维护和多源工具协同的系统。典型场景包括企业自动化运维助理、合规审核机器人、复杂流程自动执行平台等。通过源码自我改写，智能体可根据实际用户交互动态自适应，实现自动修复，降低人工维护成本，提升系统稳定性与持续升级效率。适用前提是开放源码访问权限，支持容器化部署，并具备多模型编程代理集成能力。

局限与展望

MOSS依赖高质量的失败样本采集及标注，采样不足或用户反馈不及时会影响故障批次的构建，使得目标定位模糊，降低修复效率。此外，源码改写的复杂度较高，虽引入多阶段审查与备份回滚机制，但仍存在引发新缺陷和不可预见错误的风险，提升安全保障机制仍是重点。再者，当前框架基于单实例容器设计，对于分布式、多节点协同智能体系统，跨节点状态一致性及升级问题尚未覆盖，影响扩展性和通用性。

通俗解读非专业人士也能看懂

想象你家的智能机器人完成做饭的任务，可它每次煮饭都出错，比如先炒菜再洗米，或者忘记开锅。这些错误反复出现，即使你告诉它“先洗米再炒菜”，但它总是听不懂，因为你只修改了它的“做事清单”，而它的“做饭大脑”代码没有变。

MOSS就像一位技术高手，可以直接进入机器人内核程序，改写它的做事规则。它会先收集机器人出错的具体表现，然后一步步定位问题，再制定详细的修复计划，通过智能助手帮它改代码。这个过程像反复修改建筑设计图，保证每次改动都经过检查和测试，最终修好大脑让机器人做饭的动作更顺畅。

整个修复过程在一个安全的“试验厨房”中先测试，确认没问题后再应用到真机器人身上，还能在出现故障时迅速回滚恢复。这样，机器人不仅能修正旧问题，且能自我改进，不断变得更智能可靠。

简单来说，MOSS让机器人不仅能根据指令调整“做事清单”，还能自己修正底层代码，从根本上解决反复出现的错误，让机器人越来越懂你、越来越好用。

简单解释像给14岁少年讲一样

嘿，小朋友！想象一下你有个超级酷的机器人小伙伴，但是他偶尔会搞错事情，比如把玩具放冰箱里，或者先洗手再吃饭，老犯错！怎么让他变聪明，自己发现问题还能自己修正呢？这听起来像魔法对吧！

这篇论文介绍了MOSS，一个机器人自己的“程序医生”。它会帮机器人检查哪里出错，比如哪个步骤没做好，然后给机器人写新的“说明书”，但不是普通的说明书，而是机器人的“大脑代码”。机器人自己就能学着改自己的程序，不用每次都找人工老师帮忙。

更酷的是，这个代码医生会先在“训练场”里检查修改，确认不会把机器人弄坏，才会真正换上新的大脑。想象你玩游戏升级装备，先在练习场试试看武器厉不厉害，再正式用，保证安全。

MOSS让机器人越来越聪明，能自己修复问题，给你更棒的帮手！是不是超炫？未来的机器人都能这样变得超级懂你啦！

术语表

Autonomous Agent (自主智能体)

一种能够自主感知环境、作出决策并执行任务的人工智能实体。

本文中的OpenClaw是一个生产级的自主智能体系统，执行多步骤任务。

Source-Level Rewriting (源码层改写)

直接对智能体的源代码进行修改，实现行为和结构上的改变。

MOSS通过源码层自我改写对智能体进行深层次、自主的演化。

Declarative Configuration (声明式配置)

通过文本文件描述智能体技能、提示(prompt)、内存结构等设置，便于调整行为，但有限制。

现有自主智能体自我演化仅限对声明式配置修改，难以触及底层代码。

Coding-Agent CLI (编码代理命令行接口)

一个插件式接口，调用外部大型语言模型服务，实现智能体代码的自动改写和审查。

MOSS利用多种编码代理CLI完成具体的代码定位、计划和实现任务。

Trial Worker (试验工人)

用于验证改写代码的隔离容器，回放故障批次确保修复有效，避免线上风险。

MOSS通过临时试验工人容器进行运行时回归测试。

Container Hot Swap (容器热替换)

无需停机中断，通过容器替换实现智能体版本的升级与回滚。

MOSS在用户授权下以容器热替换方式部署改写代码，保证服务连续。

Task-Evaluate Stage (任务评估阶段)

根据由失败批次对应的对话和任务输出，定性定量地评估代码改写效果的流水线步骤。

MOSS在演化循环内使用此阶段作为修复效果的判定依据。

Harness (代码核心框架)

智能体的底层调度、路由、状态管理和钩子机制组成的核心代码结构。

MOSS能够修改Harness代码，解决文本层不可及的结构性缺陷。

开放问题这项研究留下的未解疑问

1 当前自动采样的失败批次质量和覆盖范围仍有限，如何高效准确地识别所有结构性缺陷仍是挑战。
2 源码层改写带来的潜在新缺陷如何提前预测和防范，需要更智能的静态和动态分析工具支持。
3 多实例、分布式自主智能体系统中，状态同步与跨节点源码改写的协同机制尚未解决。
4 自动化演化的安全策略和用户体验优化仍需深入，尤其是自动阻断潜在严重回归的能力。
5 现有编码代理依赖外部大语言模型，如何保证模型在复杂代码库自我改写中的可靠性和效率仍待突破。

应用场景

近期应用

智能运维助理自动修复

应用于自动化运维机器人，基于真实用户操作反馈实现故障自动定位与源码修正，降低人工运维成本，提高系统可用性。

企业合规审核自动演化

满足法规审核场景，智能体通过源码层自我修正补充多数据源合规逻辑，确保输出合规性与准确性。

复杂流程自动执行平台增强

在跨服务流程自动化中，智能体能自改核心调度逻辑，修复多工具调用和数据集成错误，提升执行稳定性。

远期愿景

自主智能体操作系统构建

未来智能体将实现更深度的源码自治演化，形成能够自学习、自修复和自管理的智能体操作系统，推动AI通用化。

分布式多智能体系统协同演化

解决跨节点状态一致性与源码协作升级，支持大规模智能体集群自主管理和协同进化。

原文摘要

Autonomous agentic systems are largely static after deployment: they do not learn from user interactions, and recurring failures persist until the next human-driven update ships a fix. Self-evolving agents have emerged in response, but all confine evolution to text-mutable artifacts -- skill files, prompt configurations, memory schemas, workflow graphs -- and leave the agent harness untouched. Since routing, hook ordering, state invariants, and dispatch live in code rather than in any text artifact, an entire class of structural failure is physically unreachable from the text layer. We argue that source-level adaptation is a fundamentally more general medium: it is Turing-complete, a strict superset of every text-mutable scope, takes effect deterministically rather than through base-model compliance, and does not erode under long-context drift. We present MOSS, a system that performs self-rewriting at the source level on production agentic substrates. Each evolution is anchored to an automatically curated batch of production-failure evidence and proceeds through a deterministic multi-stage pipeline; code modification is delegated to a pluggable external coding-agent CLI while MOSS retains stage ordering and verdicts. Candidates are verified by replaying the batch against the candidate image in ephemeral trial workers, then promoted via user-consent-gated, in-place container swap with health-probe-gated rollback. On OpenClaw, MOSS lifts a four-task mean grader score from 0.25 to 0.61 in a single cycle without human intervention.

cs.AI cs.LG

参考文献 (20)

Meta-Harness: End-to-End Optimization of Model Harnesses

Yoonho Lee, Roshen Nair, Qizheng Zhang 等

2026 29 引用 ⭐ 高影响力查看解读 →

MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

Sirui Hong, Xiawu Zheng, Jonathan P. Chen 等

2023 1816 引用查看解读 →

GenericAgent: A Token-Efficient Self-Evolving LLM Agent via Contextual Information Density Maximization (V1.0)

Jiaqing Liang, Jinyi Han, Weijia Li 等

2026 4 引用查看解读 →

GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning

Lakshya A. Agrawal, Shangyin Tan, Dilara Soylu 等

2025 168 引用查看解读 →

The Claude 3 Model Family: Opus, Sonnet, Haiku

1636 引用

A Self-Improving Coding Agent

Maxime Robeyns, M. Szummer, Laurence Aitchison

2025 24 引用查看解读 →

Automated Design of Agentic Systems

Shengran Hu, Cong Lu, Jeff Clune

2024 189 引用查看解读 →

EvoAgentX: An Automated Framework for Evolving Agentic Workflows

Yingxu Wang, Siwei Liu, Jinyuan Fang 等

2025 23 引用查看解读 →

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation

Qingyun Wu, Gagan Bansal, Jieyu Zhang 等

2023 1631 引用查看解读 →

ChatDev: Communicative Agents for Software Development

Cheng Qian, Wei Liu, Hongzhang Liu 等

2023 792 引用查看解读 →

Large Language Model based Multi-Agents: A Survey of Progress and Challenges

Taicheng Guo, Xiuying Chen, Yaqi Wang 等

2024 902 引用查看解读 →

CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society

G. Li, Hasan Hammoud, Hani Itani 等

2023 1385 引用查看解读 →

From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution

Junjie Wang, Yiming Ren, Haoyang Zhang

2026 3 引用查看解读 →

ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs

Yujia Qin, Shi Liang, Yining Ye 等

2023 1552 引用查看解读 →

Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents

Jenny Zhang, Shengran Hu, Cong Lu 等

2025 97 引用查看解读 →

Toolformer: Language Models Can Teach Themselves to Use Tools

Timo Schick, Jane Dwivedi-Yu, Roberto Dessì 等

2023 3865 引用查看解读 →

SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

Ziyu Ma, Shidong Yang, Yuxiang Ji 等

2026 10 引用查看解读 →

Claw-Eval: Towards Trustworthy Evaluation of Autonomous Agents

Bowen Ye, Rang Li, Qibin Yang 等

2026 15 引用查看解读 →

A survey on large language model based autonomous agents

Lei Wang, Chengbang Ma, Xueyang Feng 等

2023 2902 引用查看解读 →

Hyperagents

Jenny Zhang, Bingchen Zhao, Wannan Yang 等

2026 4 引用查看解读 →

MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

核心发现

方法论

关键结果

研究意义

技术贡献

新颖性

局限性

未来方向

AI 总览摘要

深度分析

研究背景

核心问题

核心创新

方法详解

实验设计

结果分析

应用场景

局限与展望

通俗解读 非专业人士也能看懂

简单解释 像给14岁少年讲一样

术语表

Autonomous Agent (自主智能体)

Source-Level Rewriting (源码层改写)

Declarative Configuration (声明式配置)

Coding-Agent CLI (编码代理命令行接口)

Trial Worker (试验工人)

Container Hot Swap (容器热替换)

Task-Evaluate Stage (任务评估阶段)

Harness (代码核心框架)

开放问题 这项研究留下的未解疑问

应用场景

近期应用

智能运维助理自动修复

企业合规审核自动演化

复杂流程自动执行平台增强

远期愿景

自主智能体操作系统构建

分布式多智能体系统协同演化

原文摘要

参考文献 (20)

相关论文

DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programs

Multi-Agent Transactive Memory

DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction

Abstracting Cross-Domain Action Sequences into Interpretable Workflows

Automated reproducibility assessments in the social and behavioral sciences using large language models

The Role of Feedback Alignment in Self-Distillation

通俗解读非专业人士也能看懂

简单解释像给14岁少年讲一样

开放问题这项研究留下的未解疑问