Gemma 4 的发布代表 Google 在开源战场的最新出击。26B-A4B 采用混合专家架构(MoE),激活参数仅 4B,实际推理成本接近小模型,但性能却逼近更大参数量的稠密模型。这是 Google 用技术创新换取开发者心智的典型策略。
与此同时,豆包日均 120 万亿 Token 的数字揭示了另一个维度的竞争——谁的模型在实际应用中被调用最多,谁就拥有最多真实反馈来提升模型能力。这种「飞轮效应」让应用规模本身成为了竞争壁垒。
2026 年大模型竞争已进入双轨并行时代:前沿闭源模型(GPT-5.3、Claude 4.x)继续在能力边界冲刺;开源模型(Gemma、LLaMA、Qwen)快速追赶,并通过更低门槛打开企业私有化部署市场。两条路径会在企业采购决策中形成持续博弈。