How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

TL;DR

采用个体任务框架，利用Perplexity的搜索与Computer数据，验证AI代理提升自动化、效率与工作范围的实证效果。

cs.AI 🔴 高级 2026-06-06 117 次浏览

Jeremy Yang Kate Zyskowski Noah Yonack Jerry Ma

AI自动化知识工作代理系统任务重构生产力提升

核心发现

方法论

本文基于个体层面任务模型，结合Perplexity的搜索（Search）与Computer产品的实际生产数据，采用自然实验设计和匹配分析，比较两者在任务自动化、效率和工作范围上的差异。具体方法包括：• 以相似初始查询对作为自然实验，测算Computer在任务自主执行中的时间与质量提升；• 利用匹配对比，控制用户和任务异质性，分析Computer的自主规划与执行能力；• 通过任务分类和范围分析，评估Computer在跨职业边界、认知复杂度和任务组合上的扩展效果；• 结合成本模型和任务价值假设，推导代理系统对任务边界扩展和总价值的影响。

关键结果

在匹配会话中，Computer平均每个会话自主执行任务时间达26分钟，而Search仅33秒，提升近48倍，显著减轻用户手动协调负担。Computer自动拆解任务、执行步骤，导致后续查询偏向验证和扩展，且用户对Computer的满意度低于Search的55%。
在相同任务下，Computer将完成时间从269分钟缩短至36分钟，效率提升87%，成本降低94%，远超由人类配合Search实现的水平。此差异在多项敏感性分析中保持稳健，验证了自动化带来的巨大效率优势。
Computer显著扩展了用户的工作范围：跨职业边界的查询比例高出Search 9个百分点，认知复杂度提升（71%非例行任务对比53%），涉及更广泛的专业知识（平均2.4个O*NET知识领域对比1.7），并能将多个子任务合成单一查询，开启了以往几乎未被探索的工作活动。

研究意义

本研究首次在真实生产环境中系统量化AI代理在知识工作中的经济影响，揭示其在自动化、效率提升和工作范围扩展方面的深远潜力。结果表明，AI代理不仅能显著降低时间和成本，还能推动工作流程的创新，促进企业和个人的生产力跃升。这为未来AI在复杂认知任务中的应用提供了坚实的实证基础，也为政策制定和产业布局提供了科学依据。

技术贡献

本文提出了基于任务步骤数的成本价值模型，结合代理系统的固定成本与边际成本差异，推导出代理访问扩展任务边界、提升总价值和剩余的理论预测。创新点在于：• 构建个体任务模型，明确代理的固定成本与边际成本机制；• 通过匹配实验设计，控制用户异质性，验证代理自主执行的效率和质量提升；• 利用任务分类和范围分析，揭示代理在跨职业边界和复杂任务中的扩展能力。这些贡献丰富了AI生产力研究的理论框架，为未来任务重构和自动化路径提供指导。

新颖性

本研究的创新在于首次在实际生产环境中系统验证AI代理在知识工作中的多维影响，特别是通过个体任务模型结合大规模真实数据，量化代理的边际成本优势与固定成本负担，揭示其在任务边界扩展和工作深度上的潜力。这超越了以往实验室或模拟研究，提供了真实世界的证据，强调了自动化的经济学机制和工作重组的实际效果。

局限性

研究主要基于特定产品（Perplexity的Search与Computer），其结果的普适性需在不同平台和行业中验证；
任务价值未在数据中直接测量，依赖成本和范围指标推断，可能存在偏差；
模型假设固定成本与边际成本关系简化，未考虑复杂的交互和学习效应；

未来方向

未来研究可扩展至多行业、多任务场景，验证模型的普适性和稳健性。同时，应结合用户反馈和任务价值测量，完善自动化收益的定量评估。探索多模态、多层级代理体系，推动AI在更复杂、长远的工作流程中的应用。此外，研究应关注代理系统的伦理、偏见和控制机制，确保技术的可持续发展。

AI 总览摘要

在当今知识经济时代，AI技术正以前所未有的速度推动工作方式的变革。传统上，信息检索和辅助决策由人类操作，效率受限且成本高昂。随着生成式AI模型的突破，特别是像Perplexity推出的Computer系统，自动化已从简单的对话助手逐步演进为具备自主规划和执行能力的智能代理。这一转变不仅极大提升了任务完成的速度和质量，也深刻改变了工作内容的范围和结构。

本文以Perplexity的Search和Computer两个产品为研究对象，结合真实生产数据，系统分析了AI代理在知识工作中的实际表现。研究采用个体任务模型，将任务拆解为多个步骤，比较两者在任务自动化、效率和工作范围上的差异。通过自然实验设计和匹配分析，控制用户和任务异质性，确保结果的可靠性。

实证结果显示，Computer在单个会话中自主执行任务时间达26分钟，而Search仅33秒，效率提升近48倍。自动化不仅减轻了用户的手动协调负担，还将任务完成时间从269分钟缩短至36分钟，效率提升87%，成本降低94%。此外，Computer显著扩展了用户的工作范围，跨越职业界限，处理更复杂的认知任务，涉及更广泛的专业知识，甚至将多个子任务合成单一查询，开启了以往未曾触及的工作活动。

这些发现表明，AI代理不仅能极大提升工作效率和质量，还能推动工作内容的深度和广度的扩展。这对于企业提高生产力、优化流程具有重要意义，也为未来AI在复杂认知任务中的应用提供了实证基础。研究还揭示了代理系统在成本结构上的优势：较高的固定成本与较低的边际成本，使得更多高价值任务变得可行，从而推动工作重组和创新。

然而，研究也存在局限，如未能直接测量任务价值，模型假设简化了成本关系，未来需在多行业、多任务场景中验证其普适性。未来工作应结合用户反馈，完善价值评估，探索多模态、多层级的智能代理体系，推动AI在更复杂、更长远的工作流程中的应用。总体而言，这项研究为理解AI代理的经济学机制和实际影响提供了宝贵的实证证据，预示着未来知识工作的深刻变革。

深度分析

研究背景

随着人工智能技术的快速发展，生成式模型如GPT系列不断突破认知边界，推动信息处理、决策支持和自动化任务的革新。早期的对话助手（如聊天机器人）主要支持孤立的信息交换，局限于简单问答场景。随后，集成在办公软件中的Copilot类工具开始嵌入任务协作，辅助用户完成文档撰写、代码编写等。近年来，代理系统（Agent）逐渐成为研究热点，具备跨工具调用、长远规划和自主执行能力，代表了AI应用的下一阶段。代表性工作包括Schick等（2023）关于工具调用的自监督学习，Yao等（2023）关于推理与行动的结合，以及Kwa等（2025）提出的“时间跨度”指标，衡量代理在复杂任务中的成功率。实际部署方面，Sarkar（2026）分析了代码代理的使用行为，McCain等（2026）观察到自主任务持续时间的显著增长。这些研究共同揭示了AI代理在提升生产力、扩展工作范围中的潜力，但缺乏大规模实证验证，尤其是在真实工作场景中的经济影响。

核心问题

尽管已有大量关于AI助手和代理的研究，关于其在实际工作中的经济效应、任务重构和工作范围扩展的实证证据仍然不足。传统研究多集中于实验室或模拟环境，难以反映真实生产环境中的复杂性。具体问题包括：• 代理系统能否在长时间、多任务、多用户场景中持续保持效率和质量？• 自动化是否会引发工作内容的根本性变化，尤其是在跨职业、跨技能的任务中？• 现有模型是否能充分捕捉成本结构、任务价值和工作重组的动态关系？这些问题的解决对于推动AI在企业和个人中的广泛应用具有重要意义，也关系到未来工作制度和职业结构的调整。

核心创新

本研究的核心创新在于：1）提出基于任务步骤数的经济模型，明确固定成本与边际成本的关系，揭示代理系统在任务边界扩展中的机制；2）利用大规模真实生产数据，采用匹配设计，系统比较Search与Computer的性能差异，验证自动化带来的效率和质量提升；3）通过任务分类和范围分析，揭示代理在跨职业边界、认知复杂度和任务组合上的扩展能力。这些创新突破了以往实验室研究的局限，提供了真实世界中AI代理的量化证据，为理解其经济学机制和工作重组路径提供了新视角。

方法详解

�� 任务模型：将任务拆解为步骤，定义每个任务的步骤数（s_j）和价值（v_j），假设价值随步骤数递增；• 成本结构：假设人类操作的边际成本高于自动代理（m_conversational > m_agent），但固定成本（f_conversational < f_agent）不同；• 实验设计：利用自然实验中的匹配会话，比较相似查询的执行时间、满意度和任务范围；• 任务分类：对Computer和Search的查询进行类别划分，分析认知复杂度和跨职业边界的差异；• 价值推导：基于背包问题模型，推导代理访问如何扩展任务边界、提升总价值和剩余。

实验设计

�� 样本来源：2026年2月至5月的生产数据，包括7个样本，涵盖用户查询、任务分类、会话匹配等；• 实验对象：匹配的会话对，控制用户和任务异质性，比较Computer与Search在相似查询上的表现；• 评估指标：自主执行时间、用户满意度、任务范围、认知复杂度、知识领域覆盖；• 方法细节：采用余弦相似度匹配，筛选高相似会话，分类后分析任务复杂度和跨界行为；• 统计方法：差异检验、敏感性分析、多模型验证，确保结论稳健。

结果分析

�� Computer在匹配会话中自主执行任务时间达26分钟，远高于Search的33秒，效率提升近48倍；• 任务完成时间由269分钟降至36分钟，效率提升87%，成本降低94%；• Computer显著扩展工作范围，跨越职业界限比例高出Search 9个百分点，认知复杂度和知识领域显著增加，且能将多个子任务合成单一查询，开启新型工作活动。

应用场景

�� 立即应用：企业可利用AI代理优化客服、内容生成、数据分析等流程，降低人力成本，提高响应速度；• 长远愿景：推动智能自动化在科研、法律、医疗等领域深度融合，实现长周期、复杂任务的自主完成，重塑职业结构和工作生态。

局限与展望

�� 目前研究依赖特定平台数据，跨行业验证尚需展开；• 任务价值未直接测量，主要依赖成本和范围指标推断，存在偏差；• 模型假设简化了成本关系，未充分考虑学习效应和系统优化带来的动态变化。未来应结合多源数据和多场景验证，完善理论模型，探索更复杂的成本价值关系。

通俗解读非专业人士也能看懂

想象一下，你在厨房里准备一顿大餐。以前，你需要自己逐步准备每一道菜，从买菜、切菜、炒菜到摆盘，每一步都得自己动手，花费大量时间和精力。现在，如果有一个智能厨师助手，它可以帮你自动切菜、炒菜，甚至帮你设计菜单。你只需要告诉它你想吃什么，它就能自动完成大部分工作。这样一来，你不仅节省了时间，还能做出更复杂、更漂亮的菜肴。

这个智能助手就像是一个非常聪明的机器人厨师，它可以理解你的需求，自动规划每一步操作，甚至在你还在想下一步怎么做的时候，它已经帮你完成了。这就像是你在厨房里有了一个得力的帮手，不用担心手忙脚乱，也不用担心做错菜。它让整个做饭的过程变得更快、更轻松，而且还能做出你以前想都没想过的复杂菜肴。

这就像是AI在工作中的应用，从以前需要人类一一操作，到现在有了可以自主规划和执行任务的智能代理。它们不仅帮你节省时间，还能帮你做更复杂的事情，让工作变得更高效、更有趣。未来，这样的智能助手会变得越来越聪明，帮我们解决更多难题，让我们的生活和工作都变得更加轻松自在。

简单解释像给14岁少年讲一样

想象你在学校里做作业。以前，你得自己一个题一个题地解，花费很多时间。有时候还会出错，或者做不完。现在，假如你有一个超级聪明的朋友，他可以帮你自动解题，告诉你答案，还能帮你整理思路。你只要告诉他题目，他就能自己动手，把答案写出来。这样一来，你就可以用更少的时间，做更多的题，还能学到更多新东西。

这个朋友就像是一个智能机器人，它可以理解你的问题，自己想办法解决，还能帮你检查答案是不是对的。你不用再自己一遍遍琢磨，只需要告诉它你的需求，它就能帮你完成任务。这就像是AI变成了一位超级帮手，帮你节省时间，让你有更多时间玩耍或学习。

在工作中也是一样，以前我们需要花很多时间查资料、写报告、做分析。现在，有了智能代理，它可以帮我们自动完成这些繁琐的步骤。它不仅让工作变得更快，还能帮我们做一些以前觉得太难或太复杂的任务。未来，随着这些智能助手变得更聪明，我们的学习和工作都会变得更加轻松有趣！

原文摘要

Frontier AI systems are bridging the gap between intelligence and utility by shifting from conversational assistants to autonomous agents that execute tasks end to end. Using production data from Perplexity's Search and Computer products, we study this transition by examining how AI agents accelerate and reshape knowledge work. Three key empirical findings emerge. First, using sessions with near-identical initial query pairs as natural experiments for the same underlying task attempted with both products, Computer performs 26 minutes of autonomous work per user session, versus 33 seconds for Search. Computer automates task decomposition and execution that Search users might otherwise manually orchestrate and implement. As a result, Computer shifts follow-up query distribution toward higher-order work such as verification and extension. Autonomy also increases execution quality, with per-query dissatisfaction rates 55% lower on Computer than on Search. Second, due to its autonomy advantage, Computer reduces completion time from 269 to 36 minutes on matched tasks, lowering estimated time and cost by 87% and 94%, respectively, compared to humans equipped with Search alone. Third, Computer changes the scope of work that users attempt: Computer queries more often cross occupational boundaries, require higher-order cognition, draw on broader expertise, take the form of composite tasks that bundle interdependent subtasks into a single query, and unlock work activities that are essentially absent from Search usage among the same users. Together, the evidence indicates that AI agents accelerate workflows, enhance output quality, reduce costs, and expand the breadth and depth of automated work.

cs.AI econ.GN

How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

核心发现

方法论

关键结果

研究意义

技术贡献

新颖性

局限性

未来方向

AI 总览摘要

深度分析

研究背景

核心问题

核心创新

方法详解

实验设计

结果分析

应用场景

局限与展望

通俗解读 非专业人士也能看懂

简单解释 像给14岁少年讲一样

原文摘要

相关论文

DeepSWIP: Quotient-WMC Counterfactuals for Neural Probabilistic Logic Programs

Multi-Agent Transactive Memory

DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction

Abstracting Cross-Domain Action Sequences into Interpretable Workflows

Automated reproducibility assessments in the social and behavioral sciences using large language models

The Role of Feedback Alignment in Self-Distillation

通俗解读非专业人士也能看懂

简单解释像给14岁少年讲一样