大模型技术为视障人士打开新“视界”_科技资讯

创始人

2024-06-07 16:01:58

科技日报记者龙跃梅通讯员聂春梅

中国有大约1730万名视障人士，大模型技术有望打开他们的“视界”。6月6日，记者从阿里云深圳AI峰会上获悉，行业内首款多模态大模型视觉辅助产品“vivo看见”的累计用户已超十万。借助最新的多模态大模型技术带来的升级，“AI 向善”正从愿景变为现实。

生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯，“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花，唤起了他的童年回忆。

vivo AI研究院人工智能部总经理郝雄介绍，在这些“有温度”的场景背后，是自研蓝心大模型的支持。从2023年开始，vivo加紧大模型的研发，基于阿里云PAI机器学习的千卡大模型预训练性能接近LLaMA水平。

目前，蓝心大模型已包含十亿、百亿、千亿三个参数量级、五款不同尺寸。2023年11月上线以来，该大模型对手机的AI影像、智能助理、图文创作等场景进行了全面优化，并升级了视觉辅助产品“vivo看见”。

有了大模型的加持，“vivo看见”不仅可以在镜头对准周围环境和物品时自动播报画面内容及文字信息，还可切换到文字、卡证、条码等多种识别模式，并进行多轮对话，获取更多画面细节，同时支持常见物品查找。

郝雄表示，未来vivo还将与阿里云在算力、大模型和生态应用等方面持续合作，进一步提升智能化体验。

（主办方供图）

（来源：科技日报）