Claude Mythos Explained: Anthropic’s Most Dangerous Model Yet

TheAIGRID Youtube

上周Anthropic发了个预告视频，说他们的新模型Claude Mythos是"most dangerous model yet"。我点进去看完，第一反应是：这TM到底dangerous在哪儿了？

整个视频就是典型的科技公司宣传片套路——镜头切换、配乐渐强、几个工程师对着镜头说"这是一次能力的飞跃"，然后就没了。没有benchmark数据，没有架构细节，连个像样的demo都没给。你要说这是dangerous，我更愿意相信dangerous的是他们的marketing策略。

这事儿其实挺能说明现在大模型赛道的现状。去年大家还在比SWE-bench分数、比MMLU提升了几个点，现在直接开始玩narrative了。OpenAI说o1是"reasoning model"，Google说Gemini 2.0是"agentic era"，Anthropic这次直接上"dangerous"。问题是，当你把一个词喊得足够响，却不给实质内容的时候，这个词本身就变得dangerous了——dangerous to your credibility。

我倒不是说Mythos一定不行。Anthropic之前的Claude 3.5 Sonnet确实在代码生成和长文本理解上有明显提升，他们在Constitutional AI上的积累也是实打实的。但这次这个发布方式让人摸不着头脑。如果真有突破性进展，为什么不像OpenAI发o1那样，至少给几个标志性任务的表现？哪怕是内部测试的相对数据也行啊。

更吊诡的是"dangerous"这个定位。按照Anthropic一贯的安全叙事，他们应该是最谨慎的那个。现在突然说自己的模型dangerous，是想表达能力强到需要警惕，还是在暗示某种对齐上的突破？这个ambiguity本身就很微妙。要么是故意为之想制造话题，要么就是内部对这个模型的定位还没想清楚。

对一线工程师和产品经理来说，这种发布其实没什么actionable information。你既不知道该不该等这个模型，也不知道它能解决什么现有模型解决不了的问题。如果你现在正在做技术选型，我的建议是该干嘛干嘛，别被这种预告片打乱节奏。真要有实质性提升，等API放出来、社区跑完benchmark再说。

说到底，大模型公司现在面临的问题是：当能力提升开始边际递减，你怎么继续讲故事？Anthropic这次的答案是用一个provocative的词，但不解释。这招短期内确实能刷存在感，长期来看就是在透支信任。

所以Mythos到底dangerous在哪儿？也许最dangerous的是，我们已经习惯了在没有实质信息的情况下，就开始讨论一个模型。

Read original source →

Claude Mythos Explained: Anthropic’s Most Dangerous Model Yet

相关文章