[AINews] The Biggest Claude Launch of All Time

Latent.Space Substack

你可能没注意到,AI agent 这个概念上周悄悄完成了一次身份转变——从实验室里的技术演示变成了真正让人掏钱的产品。信号是什么?Anthropic 的 Claude Computer Use 功能上线后,成了他们史上最大的一次发布,热度甚至超过了当初 Claude 本体的任何一次更新。

这事值得琢磨。Claude 这两年发了不少东西,模型升级、context window 扩展、多模态能力,每次都有人叫好,但从推特互动数据看,这次 Computer Use 的反响是碾压级的。为什么一个"让 AI 操作你电脑"的功能会比"让 AI 更聪明"更让人兴奋?因为前者终于回答了那个被问了一年的问题:这玩意儿到底能帮我干什么?

Computer Use 的本质是把 LLM 从"对话框"里解放出来,让它直接操作界面、点按钮、填表单、跨应用协作。这听起来像是 RPA 的升级版,但实际体验完全不同。传统 RPA 需要你预先定义每一步流程,稍微换个界面就得重新配置;而 Claude 是真的在"看"屏幕、"理解"任务、"决策"下一步该干什么。这不是流程自动化,这是意图自动化。

Anthropic 能做出这个,跟他们上月收购 Vercept 有直接关系。Vercept 本来就是做 AI agent 工具链的,有现成的屏幕理解和操作执行能力。收购后一个月就上线,说明技术整合得很顺,也说明 Anthropic 对 agent 这条线的判断很坚决——他们不想只做个聊天 API,他们要做能真正"干活"的 AI。

这个判断踩对了节奏。现在大家对 LLM 的期待已经从"能聊天"变成了"能干活",而 agent 是唯一能兑现这个期待的形态。OpenAI 的 GPTs 试过,但那是个半成品,需要开发者自己搭 workflow;Microsoft 的 Copilot 也在做,但被绑在 Office 生态里,通用性不够。Claude Computer Use 直接把操作权限开放给模型,让它在你的真实工作环境里跑,这是目前最接近"AI 同事"的产品形态。

当然,风险也摆在那儿。让 AI 直接操作你的电脑,权限边界怎么划?误操作怎么办?数据隐私怎么保证?Anthropic 现在的做法是把 Computer Use 放在 API 里,需要开发者自己封装和控制,算是把责任分摊了。但这也意味着普通用户还摸不到,真正的大规模应用还得等工具链成熟。

不过市场已经用脚投票了。这次发布的热度不是技术圈自嗨,而是产品经理、运营、甚至非技术岗都在转发讨论。因为大家终于看到了一个不需要学 prompt engineering、不需要写代码、就能让 AI 帮你处理重复工作的可能性。

所以问题来了:当 AI 真的能操作你的工作环境时,你最想让它接手哪件每天都在消耗你时间的破事?