Claude Mythos Explained: Anthropic’s Most Dangerous Model Yet
上周Anthropic发了个预告视频,说他们的新模型Claude Mythos是"most dangerous model yet"。我点进去看完,第一反应是:这TM到底dangerous在哪儿了?
整个视频就是典型的科技公司宣传片套路——镜头切换、配乐渐强、几个工程师对着镜头说"这是一次能力的飞跃",然后就没了。没有benchmark数据,没有架构细节,连个像样的demo都没给。你要说这是dangerous,我更愿意相信dangerous的是他们的marketing策略。
这事儿其实挺能说明现在大模型赛道的现状。去年大家还在比SWE-bench分数、比MMLU提升了几个点,现在直接开始玩narrative了。OpenAI说o1是"reasoning model",Google说Gemini 2.0是"agentic era",Anthropic这次直接上"dangerous"。问题是,当你把一个词喊得足够响,却不给实质内容的时候,这个词本身就变得dangerous了——dangerous to your credibility。
我倒不是说Mythos一定不行。Anthropic之前的Claude 3.5 Sonnet确实在代码生成和长文本理解上有明显提升,他们在Constitutional AI上的积累也是实打实的。但这次这个发布方式让人摸不着头脑。如果真有突破性进展,为什么不像OpenAI发o1那样,至少给几个标志性任务的表现?哪怕是内部测试的相对数据也行啊。
更吊诡的是"dangerous"这个定位。按照Anthropic一贯的安全叙事,他们应该是最谨慎的那个。现在突然说自己的模型dangerous,是想表达能力强到需要警惕,还是在暗示某种对齐上的突破?这个ambiguity本身就很微妙。要么是故意为之想制造话题,要么就是内部对这个模型的定位还没想清楚。
对一线工程师和产品经理来说,这种发布其实没什么actionable information。你既不知道该不该等这个模型,也不知道它能解决什么现有模型解决不了的问题。如果你现在正在做技术选型,我的建议是该干嘛干嘛,别被这种预告片打乱节奏。真要有实质性提升,等API放出来、社区跑完benchmark再说。
说到底,大模型公司现在面临的问题是:当能力提升开始边际递减,你怎么继续讲故事?Anthropic这次的答案是用一个provocative的词,但不解释。这招短期内确实能刷存在感,长期来看就是在透支信任。
所以Mythos到底dangerous在哪儿?也许最dangerous的是,我们已经习惯了在没有实质信息的情况下,就开始讨论一个模型。