大模型技术为视障人士打开新“视界”
创始人
2024-06-07 16:01:58

科技日报记者 龙跃梅 通讯员 聂春梅

中国有大约1730万名视障人士,大模型技术有望打开他们的“视界”。6月6日,记者从阿里云深圳AI峰会上获悉,行业内首款多模态大模型视觉辅助产品“vivo看见”的累计用户已超十万。借助最新的多模态大模型技术带来的升级,“AI 向善”正从愿景变为现实。

生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯,“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花,唤起了他的童年回忆。

vivo AI研究院人工智能部总经理郝雄介绍,在这些“有温度”的场景背后,是自研蓝心大模型的支持。从2023年开始,vivo加紧大模型的研发,基于阿里云PAI机器学习的千卡大模型预训练性能接近LLaMA水平。

目前,蓝心大模型已包含十亿、百亿、千亿三个参数量级、五款不同尺寸。2023年11月上线以来,该大模型对手机的AI影像、智能助理、图文创作等场景进行了全面优化,并升级了视觉辅助产品“vivo看见”。

有了大模型的加持,“vivo看见”不仅可以在镜头对准周围环境和物品时自动播报画面内容及文字信息,还可切换到文字、卡证、条码等多种识别模式,并进行多轮对话,获取更多画面细节,同时支持常见物品查找。

郝雄表示,未来vivo还将与阿里云在算力、大模型和生态应用等方面持续合作,进一步提升智能化体验。

(主办方供图)

(来源:科技日报)

相关内容

热门资讯

谷歌Gemini和苹果的顶级华... 新智元报道 编辑:艾伦 【新智元导读】谷歌 Gemini 数据联合负责人 Andrew Dai 联...
山东北电电气取得可调节变压器整... 国家知识产权局信息显示,山东北电电气有限公司取得一项名为“一种可调节的变压器整流器”的专利,授权公告...
雷军发话了,还会坚持辟谣,让更... 作者:龚进辉 最近,小米掌门人雷军、小米董事长特别助理徐洁云均在新年首场直播中回应了“200km/h...
凡人善举|敬业奉献何小虎:在非... 一个普通人的努力,能给国家和社会带来多大的贡献和影响? 1986年底出生的何小虎,用15年时间不仅从...
中国银行:以A轮融资为起点,配... 文:韦亚军 摄影:Bob “计划”将以A轮融资为起点……解决一批“卡脖子”难题。 近日,中国银行发...