GPT-4 Turbo惨遭碾压 谷歌刚发布的Gemini 1.5 Pro有多强?
金融界
2024-02-16 18:00:43
0

原标题:GPT-4 Turbo惨遭碾压 谷歌刚发布的Gemini 1.5 Pro有多强?

在本周之前,如果被问及“地球上最强的AI模型是哪个?”时,绝大多数人都会下意识地指向OpenAI去年11月发布的GPT-4 Turbo。然而,几个月过去,这个问题的答案已经悄然发生变化。

当地时间周四,谷歌突然发布“下一代AI模型”——Gemini 1.5。相较于更新迭代的速度(注:谷歌去年12月才刚发布Gemini 1.0),新一代模型展现出的生产力暴增更是勾起了业界强烈的兴趣。

(来源:谷歌)

核心爆点:一次性处理一百万tokens

作为新版本最大的亮点,Gemini 1.5版本中首个登场的多模态通用模型Gemini 1.5 Pro,把稳定处理上下文的上限扩大至100万tokens。这里需要强调的是,虽然字面表达是“上下文”,但AI模型已经跨入多模态时代,新出的前沿大模型基本都支持处理文字、代码,以及图片、语音、视频等富媒体。

横向对比,两个月前发布的Gemini 1.0 Pro上下文理解限制为3.2万tokens,老对手OpenAI的GPT-4 Turbo也只支持12.8万tokens

(来源:谷歌)

Token这个概念可能有一点绕。换一种方式来解释,就是能够一次性丢给Gemini 1.5 Pro 超过70万个单词的文本、3万行代码、11个小时的音频,或1个小时的视频,然后指挥它干活。对大模型而言,上下文窗口是对应用场景的最主要限制——若无法“读”完50万字的文件,自然就无法进行处理。

之所以能一次性处理大量资料,是因为谷歌的模型采用了“多专家模型”(MoE)的算法,意味着回应需求时只会跑整体模型的一部分,这样回应速度更快,谷歌处理起来也更省事。

谷歌CEO皮查伊也透露,谷歌的研究人员已经成功测试过1000万tokens的上下文窗口。这意味着未来的AI模型能做到一次性处理《权力的游戏》全本(目前已经出版的5本书全文总数达到173万个单词)。

值得一提的是,目前谷歌开放给开发者的测试版本中,Gemini 1.5 Pro的token限制只有12.8万个。不过谷歌DeepMind的CEO德米斯·哈萨比斯直言不讳地表示,后续会推出新的收费层级,供解锁100万tokens的版本。作为对比,目前使用谷歌Gemini 1.0 pro模型的订阅服务每月收费19.99美元。

(Gemini 1.5 Pro各项能力显著强于1.0 pro,甚至能与1.0 ultra进行比较)

能给些实际案例么?

在周四放出的演示视频中,谷歌的研究人员上传了一份402页的阿波罗登月计划实况语音转写文档,并画了一张“靴子落地”的图片,要求AI在文件中寻找这个时刻的信息。随后,大模型准确找到宇航员踏上月球时的对话,并准确标注出文档中的位置。

另外,研究人员还上传了一段44分钟的影片,要求AI寻找“从衣服口袋里掏出纸片的时刻,并详细描述纸片上的内容”,毫无疑问,AI准确输出了提问者想要的内容。

同时,研究人员上传了手绘的“人被水龙头浇”的图片,AI也顺利在影片中找到类似的画面。

解锁更多专业场景

在技术文档中,谷歌也给出了一个有趣的用例:丢给AI一本Kalamang语(全球大概只有数百人熟练掌握)的语法书,然后对数个模型进行英语至Kalamang语,以及Kalamang语至英语的翻译测试。测试按0-6分进行评价,其中6分为完美翻译。

结果显示,Gemini 1.5 Pro在Kalamang语翻译至英语的测试中是现今表现最好的模型,而在英语翻译至Kalamang语的测试中,更是拿到5.52分的评价,比起真人语言学习者的5.6分只差一步之遥。不要忘了,AI仅仅花了几分钟输入一本语法书而已。

与此同时,由于GPT-4 Turbo和Claude 2.1都有文本窗口的限制,只能看完“半本语法书”,所以输出的结果大致处于无法应用的范围。

谷歌CEO皮查伊表示,对于企业应用而言,更大的上下文窗口大有脾益。上市公司可以一次性载入大量的财务数据,而电影制片人则能上转整部电影,并询问影评人可能会说些什么。

而对于更广泛的“吃瓜群众”而言,谷歌的这次出手,无疑给OpenAI敲响警钟——GPT-4 Turbo发布已经4个月了,什么时候拿出新一代的大模型呢?

来源:财联社

相关内容

热门资讯

“航旅小 U”以数智细节完善航... (来源:中国民航网) 转自:中国民航网 《中国民航报》、中国民航网 记者路泞 报道;航旅服务的细节进...
别让智能体陷入“降级陷阱”:如... 近日,一则引人深思的消息在科技圈内迅速传播,其内容直指当前智能体开发中的一个普遍误区,令人啼笑皆非之...
外媒:苹果首款折叠iPhone... 【环球网科技综合报道】8月25日消息,据9to5mac援引彭博社报道,马克·古尔曼日前透露,苹果首款...
快手的“AI商业内循环”跑通了 文|锦缎 每当提到那些划时代的新技术时,大多数人脑海中,总会浮现出摧枯拉朽般的颠覆景象:蒸汽机一响...
科研人员提出预测电池健康状态的... 【环球网科技综合报道】8月25日消息,根据中国科学院官网信息,中国科学院大连化学物理研究所研究员陈忠...
无线智能板如何让5G-A网络运... 在5G-A(5G-Advanced)时代,用户不仅追求“更快的网速”,更期待“始终流畅的体验”,无论...
感受时空交错 虚拟现实技术让观... 人民网记者 魏鑫 说起电影,人们总会想起黑暗中跳动的光影、耳畔流淌的声效、银幕上悲欢离合的人生…… ...
河南三门峡:一个“资源小城”的... 从“一车矿石半车土”到千亿级产业集群崛起 一个“资源小城”的科技逆袭 工人在位于河南省三门峡市的灵...
原创 印... 印度飞船空投测试(IADT-01)成功了!并且确定了首次无人测试过程,还确定要带上一台机器人飞行,进...
在数字世界“重建”海洋 只需轻点鼠标,航运公司可以在茫茫海域实时优化航线,捕鱼船可以避开大量幼年海龟,度假海岛还可以追溯漂到...
原创 星... 家人们,今天咱来聊聊宇宙里一件超级大事儿 —— 星系碰撞!最近有新研究,说 40 亿年后,银河系和仙...
原创 反... 最近这几天,嘎子哥谢孟伟又双冲上了热搜,上热搜的原因是,其直播带货又出现争议了,而且这次提出质疑的不...
青年技术团队自主研发 清淤“神... (来源:中国水运网) 转自:中国水运网 日前,由扬州航务中心邵伯船闸青年技术团队自主设计制作的“横拉...
阿里云国际站ECS:对于入门用... TG:@yunlaoda360 引言:为什么选择阿里云ECS? 阿里云弹性计算服务(ECS)是云计算...
支持24-48V电池充电,旋依... 前言 本期方案解析带来的是旋依科技300W大功率氮化镓无线充电设备的方案解析,这款无线充电设备由发...
原创 高... 编辑 | 虞尔湖 出品 | 潮起网「于见专栏」 在智能汽车赛道上,各企业如同逐鹿的骏马,全力奔腾,试...
产学研视点等多方走进中关村 e... 【产学研视点】产学研视点等多方走进中关村 e 世界,共促科技与文化交流 近日,产学研视点(中国国际...
原创 1... 在“刺客界”老炮钟薛高走到破产的边缘之后,另一位知名“刺客”共享充电宝似乎也要退场了。近日有爆料称,...
智能降级 文 | 智能降级 近来看到个最好玩的消息,大致下面这样: 看到这个内容的时候,我是真的笑喷了。 ...
小米 SU7「加长版」测试车外... 英伟达推出史上最强迷你 PC:最高 2070T AI 性能、128G 内存 日前,NVIDIA 正...