AI News: Anthropic Went Crazy This Week!

Matt Wolfe Youtube

上周Anthropic发了74个更新。对,你没看错,七十四个。

这不是那种"我们修了些bug顺便改了个配色"的凑数更新。Computer use功能正式上线,Claude现在可以直接操作你的电脑——移动鼠标、点击按钮、填表单。演示视频里它自己打开浏览器、搜索信息、复制粘贴,整个流程一气呵成。更狠的是code auto mode,给它一个编程任务,它会自己规划步骤、写代码、调试、迭代,中间不需要你插手。这已经不是copilot的概念了,这是把整个开发流程外包给AI。

同一周,Anthropic还赢了和特朗普政府的官司,拿到了禁令。然后又爆出他们有个未加密的数据库泄露了未发布的模型,包括一个叫Mythos的新model和一些内部活动信息。一边疯狂shipping,一边打官司,一边还出安全事故——这节奏确实够crazy的。

但说实话,74个更新这事儿本身不值得吹。重要的是Anthropic在做什么:他们在把Claude从一个聊天界面变成一个操作系统级的agent。Computer use意味着AI不再局限在对话框里,它可以直接介入你的工作流。Code auto mode更进一步,它要证明AI可以独立完成复杂任务,而不只是辅助。这两个功能如果真的稳定可用,对工程师的工作方式会有实质性改变。

Google这边也没闲着。Gemini 3.1 Flash Live上线,支持实时语音交互,latency低到可以做真正的对话。他们还推了个实时网站生成器,你说需求它直接给你生成网页。Lyria 3 Pro开始扩展音乐生成能力。但坦白说,Google的问题不是技术不行,是产品太散。Gemini App、Search Live、各种model版本,用户根本搞不清该用哪个。这次他们专门出了个"Switch to Gemini App"的引导,说明连Google自己都知道用户confused。

OpenAI这周有点狼狈。Sora正式版上线没多久就宣布要关停,理由是成本太高用户太少。他们还悄悄搁置了"Adult Mode"——一个允许色情内容的聊天模式,据说是因为内部担心品牌风险。更尴尬的是,ChatGPT开始接广告了,但广告主反馈说根本没法证明效果。这很好理解:用户和ChatGPT的对话是私密的,广告主看不到转化路径,自然不知道钱花得值不值。OpenAI现在的处境有点微妙,他们需要商业化,但又没想清楚怎么在保持产品体验的前提下赚钱。

这一周还有些边角料:Suno发布了v5.5,音乐生成质量又提升了;Mistral推出了Voxtral TTS,语音合成效果不错;Wikipedia宣布禁止AI生成的文章。最魔幻的是有人把Figure的人形robot带进了白宫,拍了张合影。

如果要从这一周的信息里提炼点什么,我觉得是这个:AI公司的竞争已经从model性能转向了产品形态。Anthropic在赌agent,Google在赌生态整合,OpenAI在摸索商业模式。谁能先跑通从技术到产品到商业的闭环,谁就能拿到下一阶段的入场券。至于74个更新这种事,可能只是Anthropic在向市场证明:我们不只会炼model,我们也会做产品。

问题是,用户真的需要74个新功能吗?还是说,一个真正好用的功能就够了?