摸着Manus，字节百度开始过AI Agent这条河

网络 2025-04-28 12:34 科技资讯阅读 1428

摸着Manus，字节百度开始过AI Agent这条河

通用Agent（智能体）的火爆仍在继续。

引爆这一领域的明星初创公司Manus AI，近期被曝出完成了新一轮7500万美元融资，估值在短短不到2个月内，激动人心地飙升至5亿美元。

被Manus打开未来想象空间的通用Agent市场，正在吸引一众科技大厂的入局。最新加入进来的是百度，这一步将扩展Agent市场的潜力和影响力。

近日，百度抢先发布了类通用 Agent产品“心响”，此举引发了行业的关注。值得注意的是，字节抢先一步，率先上线了自家的Agent产品“扣子空间”，为国内科技大厂树立了先河。

相比传统的Agent产品，通用Agent的本质区别在于，它的定位从“工具”向“伙伴”的角色转变，从而能够处理复杂、多步骤的任务场景。

背靠大厂已有的产品生态，字节和百度共同盯上了同一个目标，即借助 AI Agent 寻找自家 AI 产品体系的新增长点：字节试图将通用Agent概念嵌入工作流，寻找专业场景的落地应用；百度则想要在普通消费者中率先突破局面。

两者都在尝试打破各自内部的生态壁垒，构建更广泛的AI Agent生态体系，将通用Agent概念深入用户的心智。

然而，受限于大模型技术的成熟度，包括字节、百度在内的所有参与者，都不得不在探索的路上，不断地扪心自问：AI Agent的真正应用场景是什么？

无需修改，返回原始内容：01

在这个充满未知的世界中，追逐AI Agent的场景答案逐渐浮现，随着技术的不断进步，我们开始逐渐了解这些智能代理的存在和活动。

在探索差异化应用场景的道路上，字节与百度选择了不同的路径。

字节的扣子空间主要入口为网页端，更加便捷地接触日常办公场景下的软件资源；百度的心响主要面向手机端，当前仍然只支持安卓系统，旨在将自身产品嵌入用户的日常场景体验之中。

字节希望通过 AI 深度嵌入工作流已成为业界共识。扣子空间的宣传语“和 Agent 一起开始你的工作”精准地贯穿了产品逻辑。

扣子空间的最大目标：全面推动生产力提升。其中，MCP扩展中的飞书云文档、多维表格和电子表格尤为引人关注。假以时日，能够与飞书平台实现高度整合，打破生态系统的壁垒，扣子空间将演变为企业效率的“智能核心”。

我们邀请扣子空间作为一位艺术类型公众号撰稿者，搜集日本艺术家的文字与图片信息，制作成一份文字与艺术作品图片交叉的稿件。

在实际测试中，该系统的遵循能力表现出色，能够自动地检索网页、生成明确的可视化报告，整个流程流畅细腻，基本无卡顿现象。最终，它提供了一份完整、规规矩矩的文字报告，伴随着详细的作品时间轴。

字节希望将 Agent 作为办公过程中的「AI实习生」，主动帮助用户处理文件检索、表格制作、报告生成等任务。其背后的逻辑是：在企业私域内，聪明的AI辅助工具才更容易产生价值。

百度则选择进一步降低使用门槛，从更广泛的普通C端用户切入，其产品心响专为移动端设计，在实际测试中的产品逻辑有些不同：将复杂的问题留给心灵，让时间留给生活的美好瞬间。

从功能模块的设计来看，心响相对于字节的扣子空间一个最大的区别是“灵感广场”模块。在该模块内，百度的产品设计者集成了一大批任务模板，如晚安故事集、AI绘本和AI相亲等，旨在为用户提供灵感源泉和创作灵感。

然而，百度的C端策略既聚焦于培养用户的习惯，也存在一定程度的限制，对产品的想象空间产生嫌疑。从技术角度来看，心响给了外界一个明显的感受：主模型的指令遵循能力似乎并不像字节扣子空间那样精准，它的思维更加发散。

相比扣子空间的内容生成速度，百度的响应速度显得相对缓慢，生成过程也更耗时。

然而，与扣子空间严格遵循提示词、输出规整的报告不同，心响在生成结果时额外设计了交互元素和视觉优化，在输出中融入更多细节和附加价值。

这样的产品逻辑非常适合于日常场景，因为用户往往被认为在与AI的交互中，提示词工程的经验较弱，甚至很多时候自己都不清楚自己想要的是什么。

02

大厂摸着 Manus 过河

尽管产品体验上仍存在一些不完美之处，但是一大原因仍然是其在商业变现上的天花板足够高，这让字节、百度等公司竞相推出相应的 Agent 产品。

要知道，竞争已经达到现在，无论是国际上的OpenAI，还是国内的字节、百度，它们在大模型上都处于亏钱投入阶段。因此，如何找到足够强的付费变现模式，无疑是大多数大模型厂商的当务之急。

Manus成功拿下7500万美元融资的现身说法，让科技大厂眼前豁然开朗，预示着Agent领域的崭新曙光。最近OpenAI的一份预期收入报告，则让这丝曙光变得更加明亮和确定。

据The Information报道，OpenAI预测到2029年，AI Agent及其其他新产品的销售额将远远超越ChatGPT，推动总营收达到令人瞩目的1250亿美元，2030年总营收有望达到1740亿美元。Agent正被视为继对话式大模型产品之后的下一个大金矿。

对于字节和百度这样生态庞大的公司而言，在各自的生态体系中，借助需要外部MCP交互的Agent，可以实现盘活现有产品矩阵的效果。

然而，MCP本身不足以实现“世界的互通互联”。其需要大模型在多模态，尤其是推理能力，以及成本价格方面给予支持。这也反过来说明，为什么是此时此刻，字节和百度才有能力推出“扣子空间”和“心响”。

根据The Information报道，Manus在仅仅两周内，就因在 Claude大模型的调用中，烧掉了超过百万美元的成本。AI Agent的基础工作流中，多步推理是不可或缺的一部分，这种多步推理需要多次模型调用，以处理复杂任务，涉及多模态数据，如文本和图像等。这种计算量的激增，导致GPU资源的大量消耗，换言之，AI智能体需要强大的算力资源、高度多模态能力、强大的推理能力，同时又需要低成本的价格。

随着2025年推理模型的进步，尤其是在视觉推理领域的突破，使得Agent在实际产品中的部署变得技术上可行且经济上可持续。字节与百度在多模态大模型领域的早期投入终于开始收获回报，AI Agent的基础产品形态获得了现实的支撑。

近期，百度发布了文心4.5 Turbo及X1 Turbo，这两款产品的共同特点是强调推理性能与成本优化。代码智能体文心快码更是通过接入MCP，实现了更高的智能化和实时性。李彦宏本人直接提出，「创新之核心在于成本下降」，强调了技术创新对成本控制的重要性。

字节同样在4月中旬更新了豆包1.5·深度思考模型，这次的升级同样聚焦于多模态和性价比的平衡。据LatePost报道，扣子空间对比了六款国内大模型，并最终选择了自家的豆包作为基座模型技术支撑，这是因为后者推理成本较低，大规模调用可行性高。

03

大厂寻找新“增长点”旅途坎坷。

AI Agent概念虽然在热火朝天，但其定义正被泛化、滥用。通用Agent的资本故事中，每一个字都异常美妙，市场潜力巨大，但仍然面临多重技术挑战，包括高任务失败率、上下文理解不足、数据安全风险及潜在的偏见放大问题。例如，无论是Manus、还是字节的扣子空间、百度的心响，这些产品在复杂任务中的可靠性仍然不高。

从较短的时间尺度上来看，AI Agent在复杂任务中的表现仍然难以达到“通用”的高度。但是，如果将目光投射到更长远的未来，其作为大厂们AI产品体系的新增长点的潜力则无法被忽视。

没有大厂愿意冒着落后的风险，而不选择跟进。这一点深刻地体现在了中国科技大厂，特别是字节和百度身上。根据LatePost的报道，Manus出圈前后，字节就迅速组建了至少5个团队，专注于不同Agent产品的开发；百度也让一群95后组成的团队，在短短30天内完成了研发工作。

对大厂而言，技术优化迭代是必由之路，挖掘差异化的应用场景是打开这条路的关键起点。谁能率先找到复杂用户场景的解决方案，谁就能从这块蛋糕中摘取一部分的果实。

这也意味着，字节和百度绝不会是这条赛道里的唯一两大玩家。国内方面，阿里和腾讯同样虎视眈眈，紧盯着未来Agent市场的每一个细节。国外，不仅是率先确立了A2A协议的Google，MCP协议的Anthropic，OpenAI对Agent也下了重注。仅仅一个月前，The Information 就报道称，OpenAI已经与投资者进行了商议，计划发布三类未来的Agent产品，价格从每月2000美元到20000美元不等。

可以想见的是，技术、资本、场景、标准正在AI Agent领域进行激烈的混合博弈，对于大厂们而言，这不仅仅是烧钱的开始，也是为产品体系找到全新、具有商业潜力和增长性的商业引擎的起点。

赞576

 分享

共条评论

摸着Manus，字节百度开始过AI Agent这条河

评论

推荐阅读