蚂蚁集团徐鹏:百灵大模型已具备原生多模态能力
创始人
2024-07-07 09:01:01

封面新闻记者 欧阳宏宇

7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展。据蚂蚁集团副总裁徐鹏介绍,百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。

原生多模态被认为是通往AGI的必经之路,在国内,目前只有文心、通义等为数不多的大模型实现了这一能力。

记者从现场了解到,多模态技术可以让大模型更像人一样感知和互动,支撑智能体体验升级,百灵的多模态能力已应用于手机APP“智能助理”上,未来还将支持更多智能体升级。

据了解,百灵大模型多模态能力,在中文图文理解MMBench-CN评测集上达到GPT-4o水平,在信通院多模态安全能力评测达到优秀级(最高),具备支持规模化应用的能力,能支持AIGC、图文对话、视频理解、数字人等一系列下游任务。

目前,多模态大模型技术能够使AI更好地理解人类世界的复杂信息,也让AI落地应用时更符合人类的交互习惯,在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大的应用潜力。

发布现场,蚂蚁集团副总裁徐鹏还展示了新升级的多模态技术可实现的更多应用场景:通过视频对话的自然形式,AI助理能为用户识别穿着打扮,给出约会的搭配建议;根据用户不同的意图,从一堆食材中搭配出不同的菜谱组合;根据用户描述的身体症状,从一批药物中,挑选出可能合适的药,并读出服用指导,供用户参考等。

“从单一的文本语义理解,到多模态能力,是人工智能技术的关键迭代,而多模态技术催生的‘看听说写画’的应用场景,将让AI的表现更真实,更接近人类,从而也能更好地服务人类。蚂蚁会持续投入原生多摸态技术的研发。”徐鹏说。

相关内容

热门资讯

雷军宣布再办直播 相约吴佩与陈... 【CNMO科技消息】1月15日,小米集团创始人、董事长兼首席执行官雷军宣布,将于今晚8点再次开启直播...
全球“科技春晚”又增“含苏量” 受访单位供图 当地时间1月6日至9日,以“定义AI的物理边界”为主题的2026国际消费电子展(CES...
花旗CEO警告今年还有裁员行动... 来源:滚动播报 据报道,花旗首席执行官范洁恩(Jane Fraser)正在终结花旗集团落后的企业文化...
静态ISP代理是什么意思?它与... 在网络世界里,很多朋友在做业务时都会用到代理IP,但面对各种各样的代理类型,经常会感到困惑。今天,我...
美国对部分进口半导体、制造设备... 美国白宫14日发布声明,以应对国家安全威胁为由,从15日起对部分进口半导体、半导体制造设备和衍生品加...