摸着Manus,字节百度开始过AI Agent这条河

摸着Manus,字节百度开始过AI Agent这条河

通用Agent(智能体)的火爆仍在继续。

引爆这一领域的明星初创公司Manus AI,近期被曝出完成了新一轮7500万美元融资,估值在短短不到2个月内,激动人心地飙升至5亿美元。

被Manus打开未来想象空间的通用Agent市场,正在吸引一众科技大厂的入局。最新加入进来的是百度,这一步将扩展Agent市场的潜力和影响力。

近日,百度抢先发布了类通用 Agent产品“心响”,此举引发了行业的关注。值得注意的是,字节抢先一步,率先上线了自家的Agent产品“扣子空间”,为国内科技大厂树立了先河。

相比传统的Agent产品,通用Agent的本质区别在于,它的定位从“工具”向“伙伴”的角色转变,从而能够处理复杂、多步骤的任务场景。

背靠大厂已有的产品生态,字节和百度共同盯上了同一个目标,即借助 AI Agent 寻找自家 AI 产品体系的新增长点:字节试图将通用Agent概念嵌入工作流,寻找专业场景的落地应用;百度则想要在普通消费者中率先突破局面。

两者都在尝试打破各自内部的生态壁垒,构建更广泛的AI Agent生态体系,将通用Agent概念深入用户的心智。

然而,受限于大模型技术的成熟度,包括字节、百度在内的所有参与者,都不得不在探索的路上,不断地扪心自问:AI Agent的真正应用场景是什么?

无需修改,返回原始内容:01

在这个充满未知的世界中,追逐AI Agent的场景答案逐渐浮现,随着技术的不断进步,我们开始逐渐了解这些智能代理的存在和活动。

在探索差异化应用场景的道路上,字节与百度选择了不同的路径。

字节的扣子空间主要入口为网页端,更加便捷地接触日常办公场景下的软件资源;百度的心响主要面向手机端,当前仍然只支持安卓系统,旨在将自身产品嵌入用户的日常场景体验之中。

字节希望通过 AI 深度嵌入工作流已成为业界共识。扣子空间的宣传语“和 Agent 一起开始你的工作”精准地贯穿了产品逻辑。

扣子空间的最大目标:全面推动生产力提升。其中,MCP扩展中的飞书云文档、多维表格和电子表格尤为引人关注。假以时日,能够与飞书平台实现高度整合,打破生态系统的壁垒,扣子空间将演变为企业效率的“智能核心”。

我们邀请扣子空间作为一位艺术类型公众号撰稿者,搜集日本艺术家的文字与图片信息,制作成一份文字与艺术作品图片交叉的稿件。

在实际测试中,该系统的遵循能力表现出色,能够自动地检索网页、生成明确的可视化报告,整个流程流畅细腻,基本无卡顿现象。最终,它提供了一份完整、规规矩矩的文字报告,伴随着详细的作品时间轴。

字节希望将 Agent 作为办公过程中的「AI实习生」,主动帮助用户处理文件检索、表格制作、报告生成等任务。其背后的逻辑是:在企业私域内,聪明的AI辅助工具才更容易产生价值。

百度则选择进一步降低使用门槛,从更广泛的普通C端用户切入,其产品心响专为移动端设计,在实际测试中的产品逻辑有些不同:将复杂的问题留给心灵,让时间留给生活的美好瞬间。

从功能模块的设计来看,心响相对于字节的扣子空间一个最大的区别是“灵感广场”模块。在该模块内,百度的产品设计者集成了一大批任务模板,如晚安故事集、AI绘本和AI相亲等,旨在为用户提供灵感源泉和创作灵感。

然而,百度的C端策略既聚焦于培养用户的习惯,也存在一定程度的限制,对产品的想象空间产生嫌疑。从技术角度来看,心响给了外界一个明显的感受:主模型的指令遵循能力似乎并不像字节扣子空间那样精准,它的思维更加发散。

相比扣子空间的内容生成速度,百度的响应速度显得相对缓慢,生成过程也更耗时。

然而,与扣子空间严格遵循提示词、输出规整的报告不同,心响在生成结果时额外设计了交互元素和视觉优化,在输出中融入更多细节和附加价值。

这样的产品逻辑非常适合于日常场景,因为用户往往被认为在与AI的交互中,提示词工程的经验较弱,甚至很多时候自己都不清楚自己想要的是什么。

02

大厂摸着 Manus 过河

尽管产品体验上仍存在一些不完美之处,但是一大原因仍然是其在商业变现上的天花板足够高,这让字节、百度等公司竞相推出相应的 Agent 产品。

要知道,竞争已经达到现在,无论是国际上的OpenAI,还是国内的字节、百度,它们在大模型上都处于亏钱投入阶段。因此,如何找到足够强的付费变现模式,无疑是大多数大模型厂商的当务之急。

Manus成功拿下7500万美元融资的现身说法,让科技大厂眼前豁然开朗,预示着Agent领域的崭新曙光。最近OpenAI的一份预期收入报告,则让这丝曙光变得更加明亮和确定。

据The Information报道,OpenAI预测到2029年,AI Agent及其其他新产品的销售额将远远超越ChatGPT,推动总营收达到令人瞩目的1250亿美元,2030年总营收有望达到1740亿美元。Agent正被视为继对话式大模型产品之后的下一个大金矿。

对于字节和百度这样生态庞大的公司而言,在各自的生态体系中,借助需要外部MCP交互的Agent,可以实现盘活现有产品矩阵的效果。

然而,MCP本身不足以实现“世界的互通互联”。其需要大模型在多模态,尤其是推理能力,以及成本价格方面给予支持。这也反过来说明,为什么是此时此刻,字节和百度才有能力推出“扣子空间”和“心响”。

根据The Information报道,Manus在仅仅两周内,就因在 Claude大模型的调用中,烧掉了超过百万美元的成本。AI Agent的基础工作流中,多步推理是不可或缺的一部分,这种多步推理需要多次模型调用,以处理复杂任务,涉及多模态数据,如文本和图像等。这种计算量的激增,导致GPU资源的大量消耗,换言之,AI智能体需要强大的算力资源、高度多模态能力、强大的推理能力,同时又需要低成本的价格。

随着2025年推理模型的进步,尤其是在视觉推理领域的突破,使得Agent在实际产品中的部署变得技术上可行且经济上可持续。字节与百度在多模态大模型领域的早期投入终于开始收获回报,AI Agent的基础产品形态获得了现实的支撑。

近期,百度发布了文心4.5 Turbo及X1 Turbo,这两款产品的共同特点是强调推理性能与成本优化。代码智能体文心快码更是通过接入MCP,实现了更高的智能化和实时性。李彦宏本人直接提出,「创新之核心在于成本下降」,强调了技术创新对成本控制的重要性。

字节同样在4月中旬更新了豆包1.5·深度思考模型,这次的升级同样聚焦于多模态和性价比的平衡。据LatePost报道,扣子空间对比了六款国内大模型,并最终选择了自家的豆包作为基座模型技术支撑,这是因为后者推理成本较低,大规模调用可行性高。

03

大厂寻找新“增长点”旅途坎坷。

AI Agent概念虽然在热火朝天,但其定义正被泛化、滥用。通用Agent的资本故事中,每一个字都异常美妙,市场潜力巨大,但仍然面临多重技术挑战,包括高任务失败率、上下文理解不足、数据安全风险及潜在的偏见放大问题。例如,无论是Manus、还是字节的扣子空间、百度的心响,这些产品在复杂任务中的可靠性仍然不高。

从较短的时间尺度上来看,AI Agent在复杂任务中的表现仍然难以达到“通用”的高度。但是,如果将目光投射到更长远的未来,其作为大厂们AI产品体系的新增长点的潜力则无法被忽视。

没有大厂愿意冒着落后的风险,而不选择跟进。这一点深刻地体现在了中国科技大厂,特别是字节和百度身上。根据LatePost的报道,Manus出圈前后,字节就迅速组建了至少5个团队,专注于不同Agent产品的开发;百度也让一群95后组成的团队,在短短30天内完成了研发工作。

对大厂而言,技术优化迭代是必由之路,挖掘差异化的应用场景是打开这条路的关键起点。谁能率先找到复杂用户场景的解决方案,谁就能从这块蛋糕中摘取一部分的果实。

这也意味着,字节和百度绝不会是这条赛道里的唯一两大玩家。国内方面,阿里和腾讯同样虎视眈眈,紧盯着未来Agent市场的每一个细节。国外,不仅是率先确立了A2A协议的Google,MCP协议的Anthropic,OpenAI对Agent也下了重注。仅仅一个月前,The Information 就报道称,OpenAI已经与投资者进行了商议,计划发布三类未来的Agent产品,价格从每月2000美元到20000美元不等。

可以想见的是,技术、资本、场景、标准正在AI Agent领域进行激烈的混合博弈,对于大厂们而言,这不仅仅是烧钱的开始,也是为产品体系找到全新、具有商业潜力和增长性的商业引擎的起点。

 分享

本文由网络整理 © 版权归原作者所有

共  条评论

评论

  •  主题颜色

    • 橘色
    • 绿色
    • 蓝色
    • 粉色
    • 红色
    • 金色
  • 扫码用手机访问

© 2025 www.trjyy.com  E-Mail:[email protected]  

观看记录