6月27日消息,据外媒报道,谷歌推出了 Gemma 3n多模态模型,旨在将大型多模态 AI 功能引入边缘设备。
外媒称,Gemma 3n 的设计理念为移动优先,能够在本地设备上处理和理解文本、图像、音频和视频,而无需依赖云端。这一架构代表着其在智能手机、可穿戴设备和智能相机等设备上实现隐私保护和实时 AI 体验方面迈出了重大一步。
据悉,Gemma 3n 系列包含两个版本,分别为Gemma 3n E2B和Gemma 3n E4B。经过优化,二者性能分别与传统的 5B 和 8B 参数模型相当,同时占用更少的资源。这些模型集成了架构创新,可大幅降低内存和功耗需求,从而能够在边缘设备上进行本地高质量推理。