Anthropic just released the real Claude Bot...

Fireship Youtube

看到Anthropic发布Computer Use功能,我第一反应不是兴奋,是疑惑:为什么大家突然都急着让AI控制你的电脑?

OpenAI搞Operator,Anthropic跟进Computer Use,表面上看是agent能力的军备竞赛,但本质上这是个很微妙的timing问题。现在的LLM在复杂任务规划上还经常翻车,却急着要接管你的GUI操作,这就像一个刚学会认路的人非要给你开车——技术上能做,但真的ready了吗?

Anthropic这次的卖点是Claude可以直接操作电脑界面,点击、输入、截图判断,听起来很科幻。但早期测试反馈很有意思:它确实能完成一些简单任务,比如填表单、查信息,但一旦遇到稍微复杂点的workflow,或者界面有点变化,就开始迷路。这不是Claude的问题,是整个技术路线的问题——用视觉识别和坐标点击来操作GUI,本身就是个又慢又脆弱的方案。

对比一下就清楚了。真正靠谱的自动化应该走API路线,结构化输入输出,可预测可调试。Computer Use这种模拟人类操作的方式,看起来通用性强,实际上是在用最低效的方式解决问题。你想想,为什么RPA(Robotic Process Automation)这么多年都没真正起飞?因为基于GUI的自动化天生就容易坏,维护成本高得离谱。

更关键的是应用场景。工程师和产品经理真的需要一个AI帮你点鼠标吗?我们需要的是能理解需求、生成代码、处理数据的工具,而不是一个会用鼠标的实习生。如果你的工作流程还停留在手动点点点的阶段,问题不在于缺一个AI助手,而在于你的工具链该升级了。

当然,也不是说Computer Use完全没价值。对于那些legacy系统,没有API、没有文档、只能通过界面操作的场景,这确实是个无奈但有用的方案。但把它包装成"gamechanger"就有点过了。这更像是个权宜之计,而不是未来方向。

Anthropic和OpenAI在这个赛道上的竞争,说白了是在赌一个问题的答案:用户到底想要什么样的AI?是一个能完美执行指令的工具,还是一个能自主决策的agent?现在看来,两家都在往后者押注,但市场可能还没准备好。

如果你真的要试Computer Use,建议先想清楚:这个任务用传统脚本或API能不能搞定?如果能,就别折腾AI了。AI应该用在真正需要理解和推理的地方,而不是当一个昂贵的鼠标驱动器。