Anthropic just released the real Claude Bot...

Fireship Youtube

看到Anthropic发布Computer Use功能，我第一反应不是兴奋，是疑惑：为什么大家突然都急着让AI控制你的电脑？

OpenAI搞Operator，Anthropic跟进Computer Use，表面上看是agent能力的军备竞赛，但本质上这是个很微妙的timing问题。现在的LLM在复杂任务规划上还经常翻车，却急着要接管你的GUI操作，这就像一个刚学会认路的人非要给你开车——技术上能做，但真的ready了吗？

Anthropic这次的卖点是Claude可以直接操作电脑界面，点击、输入、截图判断，听起来很科幻。但早期测试反馈很有意思：它确实能完成一些简单任务，比如填表单、查信息，但一旦遇到稍微复杂点的workflow，或者界面有点变化，就开始迷路。这不是Claude的问题，是整个技术路线的问题——用视觉识别和坐标点击来操作GUI，本身就是个又慢又脆弱的方案。

对比一下就清楚了。真正靠谱的自动化应该走API路线，结构化输入输出，可预测可调试。Computer Use这种模拟人类操作的方式，看起来通用性强，实际上是在用最低效的方式解决问题。你想想，为什么RPA（Robotic Process Automation）这么多年都没真正起飞？因为基于GUI的自动化天生就容易坏，维护成本高得离谱。

更关键的是应用场景。工程师和产品经理真的需要一个AI帮你点鼠标吗？我们需要的是能理解需求、生成代码、处理数据的工具，而不是一个会用鼠标的实习生。如果你的工作流程还停留在手动点点点的阶段，问题不在于缺一个AI助手，而在于你的工具链该升级了。

当然，也不是说Computer Use完全没价值。对于那些legacy系统，没有API、没有文档、只能通过界面操作的场景，这确实是个无奈但有用的方案。但把它包装成"gamechanger"就有点过了。这更像是个权宜之计，而不是未来方向。

Anthropic和OpenAI在这个赛道上的竞争，说白了是在赌一个问题的答案：用户到底想要什么样的AI？是一个能完美执行指令的工具，还是一个能自主决策的agent？现在看来，两家都在往后者押注，但市场可能还没准备好。

如果你真的要试Computer Use，建议先想清楚：这个任务用传统脚本或API能不能搞定？如果能，就别折腾AI了。AI应该用在真正需要理解和推理的地方，而不是当一个昂贵的鼠标驱动器。

Read original source →

Anthropic just released the real Claude Bot...

相关文章