谷歌昨天发布了 Gemma 4,这次非常牛逼!
专门用来在本地设备上跑 agent ,还支持多模态。
四个参数大小:
E2B:主打手机 / IoT / 边缘设备。
E4B:为移动端 + Jetson / 树莓派设计。
26B MoE:单次激活 3.8B,有效参数很小,主打高 TPS、低延迟。
31B Dense:全密集 31B,主打桌面工作站 / 单卡 H100 等。
这次他们把 Agency Workflows 的支持作为第一优先级:原生支持 Function Call、JSON 和结构化输出、System Instruction。
更强的是这玩意还是原生多模态模型,支持:图像和视频理解,语音转文本,可以做本地语音助手。
而且它们这次是真正的 Apache 2.0 开源,允许商用、再分发和内嵌产品,以及私有部署,没有额外条款。
谷歌还发布了一个安卓应用,来体验他们这次新发布的 Gemma 4 模型。
我用我现在的小米 17 Ultra 试了一下,在用这个 E4B 模型的时候,推理速度非常快。
而且这个 App 现在还内置了一个 Skills 的体验区域,你可以自己去让它调用工具编写和试用 Skills。
可以在 Google Play 搜索 Google AI Edge Gallery 下载使用。
详情:
blog.google