2026年1月还没过完,硅谷投资人已经忙起来了,UC Berkeley 的 Sky Computing Lab 在短短三周内成了创投圈的焦点:SGLang (RadixArk) 以 4 亿美元估值融资,vLLM (Inferact) 在 8 亿美元估值下融资 1.5 亿,而 LMArena 更是以 17 亿美元的估值完成了新一轮融资。这一系列动作再次证明,Ion Stoica 教授是当前最成功的孵化者,他总能精准地在 AI 浪潮的关键节点把研究推向产业。
这种投融资热点的位移,背后是开源模型力量的集中爆发。按照目前的行业节奏,开源模型大约落后闭源模型 6 到 12 个月,这意味着在今年,我们会密集看到能媲美 GPT-5.2、Claude Opus 4.5 以及 Gemini 3 的顶级开源模型出现。
当高性能模型不再是闭源巨头的垄断资源,市场上必然会涌现出大量的 Model Inference Provider。而随着开源模型走向主流,模型推理(Inference)的效率、成本以及客观的评价体系,才是今年竞争最激烈的战场。对应用开发者而言,这不仅意味着模型能力的普惠,更意味着市场上将出现大量不同性价比组合的 Inference 服务可供灵活选择。