原来是谷歌Open了AI?
果壳网
2024-02-22 17:53:06
0

原标题:原来是谷歌Open了AI?

太热闹了。Google发布Gemini1.5的时候,被 OpenAI 的 Sora 截胡抢了风头。这些天,铺天盖地都是“Sora又让人类完了”的新闻。

昨夜,“悄悄地”,Google发布了自己的开源大模型——一款能跑在你笔记本电脑上的大模型

最强的开源模型!

Google 开放了与 Gemini 模型“同源”的轻量级模型——Gemma(取拉丁文“宝石”之意)。Gemma 模型包括两种权重规模,“Gemma 2B”和“Gemma 7B”,分别对应 20 亿参数和 70 亿参数版本。

“宝石”开源模型丨Google

对于 Gemma 的技术细节深挖和测试之后,大家的“兴奋点”主要在,Gemma 的性能表现和对于开发者的友好和易用性

首先,与参数规模相当的模型进行比较,在涵盖语言理解,推理,数学,编程的8项基准测试中,Gemma(7B)超过了LLaMA 2(7B)、LLaMA 2(13B)和Mistral(7B)(除了在语言理解上弱于LLaMA 2(13B))。

每种规模模型都有预训练和指令微调变体。Google十分强调 Gemma 开源模型的安全性

Google 进行了大量的微调和人类反馈强化学习(RLHF),降低模型带来的风险,经过指令微调的Gemma-2B IT和 Gemma-7B IT模型,在人类偏好评估中都超过了Mistal-7B v0.2模型。特别是Gemma-7B IT模型,它在理解和执行具体指令方面,表现得更加出色。——与Google负责任的AI目标对齐

官方给出的数据对比丨Google

深度学习框架 Keras 的作者 François Chollet 对此称,“最强开源模型易主。”

其次,方便易用。

用户能通过 Colab 和 Kaggle notebooks(可以理解为一个在线notebook,用于运行代码),以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM 等流行工具集成。

上线Hugging Face的Gemma丨Hugging Face

Gemma 可以被轻松部署在资源有限的环境中,比如笔记本电脑,台式机,Google Cloud,Vertex AI(训练和部署模型和应用的ML平台)和 Google Kubernetes Engine(托管环境,在里部署、管理和扩缩容器化应用),以满足开发者不同需求。

尤其是今天很多端侧设备,比如手机车机电脑等,都在进行“AI转型”,灵活、运行成本低的轻量级模型,有了更明确的商业前景。

大模型怎么还分“开”和“闭”

这一轮生成式 AI 浪潮是由 ChatGPT 掀起的,毫无置疑,对大模型的普及和加速,OpenAI 所起到的贡献也是最大的。“但是名为Open,却正变得越来越封闭”,一些声音说。

Meta、Mistral 因为开源,赢得不少赞誉。开源,是一种“众人拾柴火焰高”的策略,一个开放的生态系统,能吸引开发者加入,他们的生产力“反哺”到模型本身。

在开放和垄断的问题上,龙与屠龙者的身份不断交换丨Giphy

对于 Meta 开源LLaMA 2,Yann LeCun(杨立昆)说,“这将改变大模型市场的格局。”

美国斯坦福大学基金会模型研究中心主任 Percy Liang 说,“对于许多应用场景来说,你不需要 GPT-4,相较于一个庞大、复杂的专有模型,一个更可定制、更透明的模型——比如 Llama 2,可能会帮助公司更快地创造产品和服务。”

Mistral 想法与之类似。小模型能将 Agents 运行的计算成本降低,有机会构建更多有意思的应用。

Gemma(7B)用到6万亿Token,效果和Mistral 7B 差不多,之前大家也猜测 Mistral 7B使用了7万亿Token。Gemma再次证明,数据质量足够好(比如Google说Gemma数据集以数学,代码数据为主),小模型的能力仍然能够持续提升。

Hugging Face是目前最著名的开源模型基地丨Giphy

Mistral AI CEO Arthur Mensch 说,“开源让模型受到公众监督,更加安全。”分歧的声音说,闭源优势在于可控性,和知识产权保护。闭源模型相对成熟,数据质量更有保障。拼模型规模上,开源相对闭源处于劣势,大模型对于资源的消耗,是少有公司能承担的。产生路线的分歧,来自各自的商业逻辑。

Google 开源 Gemma,无论步子大小,是主动出击,还是防御战略,至少为开发者提供了更多选择,对大模型的开源生态注入一股新鲜活力。

谷歌曾经Open了哪些AI?

纵观 Google 的历史,你能看到很多其为 AI 开放开源所做的贡献。

Transformers

在“谷歌大脑”于2017年的一篇论文中最先提出(Attention Is All You Need),很快成为自然语言处理和电脑视觉领域的主流方案,目前我们谈论的这些“生成式AI大模型”,几乎都是以Transformers为基础的。如那篇论文题目,Transformers的核心机制叫做“自注意力”,简单粗暴的理解,就是让AI获得了分辨数据优先级的能力,从看什么都兴奋语无伦次的“多动症”,变成了“正常人”

Transformer的开放使用,塑造了我们这个AI时代。

不是这个Transformer哦丨Giphy

TensorFlow

TensorFlow 是一个开源机器学习平台,同样由“谷歌大脑”团队开发,于2015年首次发布,继而迅速成为各类“含 AI 应用”开发者们最常用的创作平台。谷歌在2016年还专门为 TensorFlow 开发了一款“人工智能加速处理器”,TPU——目前也和大家熟悉的GPU一样,被用于各种AI大模型的训练。

JAX

JAX 是谷歌开发并开放的一种 Python 机器学习框架,开发者常拿来与 TensorFlow 一起配合使用,甚至有人曾预言它将取代 TensorFlow。

AlphaFold

这是一个用来预测蛋白质结构的工具,也属于一种深度学习系统。最早由谷歌在2018年发布,并在2020年更新了第二代版本。“蛋白质结构预测”是生物学和医学中最重要的命题之一,在这个领域的权威会议CASP中,2016年前各类传统方式预测得分最高只有40/100,而AlphaFold在2020年取得了92.4/100的成绩。在新冠疫情期间,AlphaFold还对新冠病毒蛋白质结构的研究起到了重要作用。

而今天 Google 推出 Gemma,再一次掀起构建开源模型的浪潮,抢先了 Llama 3。接下来,就看 Meta 将会如何接招了。

作者:沈知涵

编辑:卧虫

Guokr

苹果Vision Pro,真机实测来了!Vision Pro号称是一款革命性的空间计算机,将带来虚拟键盘、眼球追踪、语音识别等新的交互方式。不过3499美元(约合2.48万元人民币)的苹果混合现实大眼镜门槛属实不低,虽然没买到,但总能看看吧~

2 月 23 日(周五)18:30果壳将开启Vision Pro 真机直播实测!直播中,你将目睹 Vision pro 的超清显示效果、流畅的操作体验和独特的交互方式,主播还会解答关于 Vision pro 的各种问题,分享他们的使用感受。

如果你想入手一台,先进直播间看看值不值得买?已经是氪金机主,也欢迎大家在直播中来吐槽和分享体验。上方预告按钮,可预约直播。

我们不见不散,一起来感受未来科技的震撼吧!

如有需要请联系sns@guokr.com

相关内容

热门资讯

用乐高积木组装3D打印机:还真... 快科技8月28日消息,此前有过不少3D打印机,也有过一些精妙的乐高项目,但是将两者如此和谐地结合在一...
打字一天收入170元,这个微信... 最近总有人问我:“在家打字就能赚钱,这事儿靠谱吗?不会是骗流量的吧?” 其实还真不是忽悠 —— 现在...
安瓿瓶耐内压测试仪意义 安瓿瓶耐内压测试仪,是专门用于检测安瓿瓶(一种用于盛装药液的玻璃 / 塑料密封容器)在内部压力作用下...
原创 闺... 近年来,闺蜜机(随心屏)作为智能家居领域的新兴产品,迅速赢得了众多消费者的青睐。它集移动便捷性、多功...
英伟达推出机器人“最强大脑”,... 21世纪经济报道记者 邓浩 算力正在成为机器人产业的“通胀”环节,由此催生域控的强劲需求,吸引众多A...
从零开始引流兼职粉到微信,完整... 我还是要先说一个大前提:微信永远是最终的流量归宿,不管你是从小红书、抖音,还是从贴吧、知乎,甚至百度...
腾讯会议正式上线“AI纪要”功... 多知8月27日消息,近日,腾讯会议PC端及移动端正式上线“AI纪要”功能。 在会议过程中,“AI纪要...
原创 7... 终于官宣了!苹果秋季发布会时间敲定——9月10日凌晨1点。临近发布会,iPhone17系列的爆料也越...
国家自然科学基金重大研究计划集... (来源:黑龙江日报) 转自:黑龙江日报 本报讯(记者周姿杉)近日,由哈尔滨理工大学、哈尔滨工业大学、...
从一刀切到量身定制,营养管理愈... 来源:观看望视 “全球营养健康产业正处于快速发展与转型阶段。”8月25日,在“科技向善,重构营养健康...
新华鲜报|重大部署!中国“人工... 8月26日,“人工智能+”行动迎来重要进展:国务院印发的《关于深入实施“人工智能+”行动的意见》对外...
华磊迅拓MOM赋能光伏智造,从... 导语 当前,在全球能源转型浪潮和国家“双碳”战略的强力驱动下,中国光伏产业迎来爆发式增长,持续引领全...
绿色云图液冷落地中国电信大型数... 近日,中国电信华北区某大型浸没式液冷数据中心项目顺利完成关键流程,项目规模达数千万元级。作为国内运营...
原创 O... 「松叶绿」配色背后的军工级防护 第一眼看到OPPO A3i Plus的松叶绿版本时,很多人会被它低调...
永州柳子中学:遨游科技世界 点... 红网时刻新闻8月28日讯(通讯员 田磊 张珊)科学拓宽视野,技术引领未来。为激发青少年科学探索热情、...
马斯克的星舰飞船在第10次试飞... 来源:环球市场播报 当地时间周二,马斯克的SpaceX公司发射了巨型“星舰飞船”火箭,进行了第十次试...
科股早知道:力箭二号发射设备工... 必读要闻一:华为云称将更多的资源投入到AI产业和算力产业上 据媒体报道,华为云近日宣布组织架构调整,...
Broadcom将私有AI整合... Broadcom VCF部门产品营销副总裁Prashanth Shenoy表示:"我们希望在VCF中...
路透社:字节跳动估值超3300... 据路透社报道,三位知情人士表示,短视频应用 TikTok 的所有者字节跳动将启动一项新的员工股票回购...
Rokid Glasses智能... Rokid Glasses智能眼镜近日在纽约正式向海外市场发布,这一里程碑式的事件标志着全球可穿戴人...