[AINews] Meta Superintelligence Labs announces Muse Spark, first frontier model on their completely new stack

Latent.Space Substack

上周 Meta 悄悄发了个东西，名字挺唬人——Meta Superintelligence Labs，还带着他们的第一个 frontier model Muse Spark。但你要是仔细看，会发现这次真正的主角不是 model 本身，而是藏在后面那句话：completely new stack。

这事得这么看。Meta 这几年在 AI 上一直有个尴尬：model 开源做得风生水起，Llama 系列该有的 benchmark 数字都不差，社区也捧场。但你要问他们自己的基础设施怎么样？说实话一直是个谜。外界能看到的就是他们疯狂采购 GPU，偶尔透露点自研芯片的消息，然后……就没然后了。不像 OpenAI 和 Anthropic 那样，infrastructure 和 model 的进化节奏基本是锁死的，你能感觉到他们在一个完整的飞轮里转。

Muse Spark 这次的发布，Meta 终于把这层窗户纸捅破了。他们在说：我们现在有自己的完整 stack 了，从训练到 inference，从硬件到调度，都是自己的。model 的数字"not much, but good"——这个表述其实挺诚实，翻译过来就是：能打，但还不是最强的那个。重点在后半句：bigger models are already in development with infrastructure scaling to match。

这才是 Meta 真正想传递的信号。他们不是在秀一个 model，而是在证明自己终于有能力把 model 和 infrastructure 绑在一起往上冲了。你看 OpenAI 从 GPT-3 到 GPT-4，每次 model 升级背后都是整个训练系统的重构。Anthropic 的 Claude 也一样，每次 latency 和 throughput 的优化都能看出他们对底层控制力在变强。Meta 之前缺的就是这个——他们有钱买卡，有人才做 model，但中间那层"怎么把资源高效转化成 model 能力"的 know-how，一直没对外展示过。

现在他们开始给 select partners 开 private API preview 了，这个动作也挺有意思。不是直接公开，也不是继续闷头开源，而是先找一批人试水。这说明 Meta 自己也知道，这套 stack 还需要在真实场景里验证。毕竟 infrastructure 这东西，不是跑个 benchmark 就能证明行不行的，得看在不同 workload 下会不会崩，scaling 的时候瓶颈在哪，成本能不能打平。

对国内的团队来说，这事儿其实挺有参考价值的。大家现在都在卷 model，但真正拉开差距的往往是那些看不见的部分：你的训练能不能快速迭代，inference 的成本能不能压下来，遇到突发流量会不会直接趴窝。Meta 这次的信号很明确：光有 model 不够，得有自己的 stack。

所以问题来了：你们现在用的 infrastructure，是真的能支撑你们想做的 model，还是在拿别人的轮子硬拼？

Read original source →

[AINews] Meta Superintelligence Labs announces Muse Spark, first frontier model on their completely new stack

相关文章