两个 AI Agent 产品撞在一起,我发现了一些有趣的事
最近顺手把 Anthropic 的 Cowork 和最近在 GitHub 上狂飙的 OpenClaw 放在一起比了一遍。越看越觉得——这两个产品像是两种完全不同的"世界观"碰撞出来的结果。
先说说这两个东西分别是什么
Cowork 是 Anthropic 做的桌面端 Agent 工具,目标用户是不懂代码的普通人。你可以用它来自动化处理文件、跑任务、做内容生产,背后跑的是 Claude,整个环境运行在本地一个沙箱 Linux 虚拟机里。简单说,就是一个"帮你干活的 AI 桌面助理"。
OpenClaw 则完全不同。它是一个开源的个人 AI Agent 框架,MIT 协议,前身叫 Clawdbot,2026 年 1 月改名之后一度冲上 GitHub 趋势榜前列。它的核心设计是:在你本地跑一个常驻的 Node.js 进程,然后通过 WhatsApp、Telegram、Slack、Discord 等 20 多个消息渠道来控制这个 Agent。数据全部以 Markdown 文件形式存在你本地磁盘上。
一个是"我帮你搞定一切,你不用懂技术";一个是"你自己部署,数据自己管,模型随便换"。
立场鲜明,一上来就泾渭分明。
它们其实比你想象的更像
在聊差异之前,先说说两者惊人相似的地方——因为这些相似点本身就很有意思。
都用"技能包(Skill)"作为扩展单元。 两者都没有把所有能力塞进一个大模型里,而是把功能拆成一个个可插拔的 Skill,想要什么能力就装什么包。这不是巧合,而是大家在实践中得出的同一个结论:Monolithic Agent 不 work。
都跑在本地,而不是纯云端推理。 无论是 Cowork 的沙箱 VM,还是 OpenClaw 的本地 daemon,真正的执行动作都发生在你的机器上。这是 Agent 能"干实事"的前提——光在云端生成文字没用,得能写文件、跑命令、控制浏览器。
都把"触发"做成了核心体验。 两者都在思考同一个问题:用户在哪里、用什么方式触发 Agent?这个问题的答案直接决定了产品的留存逻辑。
但它们的世界观截然不同
1. 模型绑定 vs 模型自由
Cowork 深度绑定 Claude,这是它的护城河,也是它的边界。你能享受到 Claude Computer Use 这类深度能力,但你没得选。
OpenClaw 则模型无关,Claude、GPT、本地模型,随你配。这让它的受众更广,但也意味着它没办法做深度的模型级优化——它的价值在"框架"本身,而不在"哪个模型最强"。
这里有个很值得思考的取舍:模型无关换来的是用户规模,模型深度集成换来的是体验上限。 做产品的时候,这个问题在立项阶段就要想清楚。
2. 入口在哪里
Cowork 把入口收在桌面 App 里,体验可控,但用户需要"专门打开一个 App 来用 AI"。
OpenClaw 的思路完全反过来——你不需要打开任何新 App,你在 Telegram 上发条消息,Agent 就帮你干活了。你本来每天就在用 WhatsApp,摩擦几乎是零。
这个设计让我印象很深。渠道即入口,入口即黏性。 你把 Agent 嵌在用户已有的工作流里,留存成本比拉人打开一个新 App 低太多了。做 B 端 Agent 的时候,这个逻辑同样成立——嵌进企微、飞书、Slack,比要求用户专门切换工具要聪明得多。
3. 数据在哪里
这是两者最本质的价值观分歧。
OpenClaw 把记忆存成本地 Markdown 文件,跨 session 持久化,数据完全归你。对于在意数据主权的用户(比如企业内部部署场景),这是一个很硬的卖点。
Cowork 依赖 Anthropic 平台,好处是你不用操心数据管理,坏处是数据上云这件事本身对很多用户来说就是心理障碍。
4. 安全边界
Cowork 用 Linux VM 做沙箱隔离,Agent 做的任何操作都在虚拟机里,出不来。
OpenClaw 的 daemon 直接跑在宿主机上,权限更大,但风险敞口也更大。
这不只是技术选择,而是产品价值观:你是要给用户更多控制权,还是帮用户把危险的东西挡在外面?两种答案都没错,但必须在架构层就定好——Agent 有写文件和执行命令的能力,安全模型事后补代价极高。
对做 Agent 的人,这些对比能给什么启发?
总结几点我觉得比较有价值的判断:
Skill 的颗粒度要做对。 功能内聚、输入输出清晰,是一个好 Skill 的标准。不要按"工具类型"分,要按"用户想完成什么事"分。
持久记忆是 Agent 的核心护城河。 一个每次都要你重新介绍背景的 Agent,用户很快就会放弃。记忆模块——存什么、怎么检索、什么时候遗忘——值得认真设计,而不是靠 system prompt 凑合。
触发摩擦决定用活率。 你的 Agent 入口在哪里?用户能不能在他们本来就在用的地方触发你?这个问题比"Agent 能力有多强"更影响 DAU。
开源 ≠ 没护城河。 OpenClaw 的护城河是社区生态和数据主权叙事,这在特定用户群里非常有吸引力。闭源产品的护城河是体验深度和模型集成。两条路都能走,关键是想清楚你的用户到底在乎什么。
两个产品都还在早期,谁也没到终局。但把它们放在一起看,能更清楚地看出 AI Agent 这个赛道正在分叉——一边是体验驱动的平台化路线,一边是控制权驱动的开源路线。
接下来会怎么演?挺值得持续观察的。