计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态
创始人
2025-12-29 00:41:14

今天分享的是:计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石

报告共计:23页

GenAI领域技术迭代与生态拓展总结

当前GenAI领域竞争重心正从商业模式转向底层硬科技实力,头部企业凭借长期技术积累与生态整合,推动行业快速发展,其中火山引擎豆包大模型与阿里千问APP的最新动态尤为引人注目。

火山引擎在FORCE原动力大会上发布多款升级产品,豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度实现显著增强,其多模态理解与智能体执行力已与Qwen3比肩,在数学推理、长视频解析及文档图表理解等核心场景表现突出。视频生成模型Seedance 1.5 Pro凭借“声画一体”原生架构,在音频质量、同步性及表现力等方面优于同类产品,Draft样片功能可提升创作效率65%。此外,图像创作模型Seedream 4.5和语音识别模型2.0进一步丰富了豆包模型家族,语音识别的上下文关键词召回率提升20%,还支持多模态视觉识别。截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较9月大幅增长,在单位推理成本降低的趋势下,商业化路径逐渐清晰。

阿里千问APP公测后表现亮眼,上线23天月活用户即突破3000万,其核心进展是正式接入高德地图,实现从“理解用户意图”到“执行具体服务”的跨越。借助高德的实时路况、扫街榜等数据,千问APP可智能规划出行路线、推荐餐厅,支持多需求协同处理。实测显示,在出行游玩路线规划、路线时长估计和周边餐厅推荐等场景中,千问APP能提供结构化答案、实时数据支撑及可直接执行的操作链接,实用性突出。这种通过APP授权整合服务的模式,为后续接入淘宝、飞猪等更多阿里系应用奠定了基础,有望构建覆盖多元场景的超级Agent生态。

整体来看,GenAI行业正呈现技术迭代加速、生态整合深化的趋势。大模型的发展愈发依赖基础研究积累、算力工程能力和算法创新,头部企业通过持续的产品升级与场景拓展,不断强化核心竞争力,推动AI技术从信息交互向现实世界服务执行深度渗透。

以下为报告节选内容

相关内容

热门资讯

周鸿祎西安交大校庆对话青年学子... 近日,西安交通大学迎来建校130周年暨西迁70周年纪念大会。360集团创始人、西安交大杰出校友周鸿祎...
35岁程序员辞职摆摊卖肉蛋堡:... 快科技4月9日消息,近日,35岁的程序员刘先生成了网络热议的焦点。 在辞去高压的软件开发工作后,他选...
刘云:词元供给,如何“用得起”... 智能经济新业态正加速发展,词元(Token)已成为最基础且普遍的需求。数据显示,今年3月,我国日均词...
AI时代不该患上“失语症” 当下,网络信息的碎片化与快节奏传播,正在推动语言不断简化,催生出了非常流行的“夯”“拉”等网络词语。...
余承东朋友圈痛批团队有些零售设... 日前,网间曝光了一张华为常务董事、产品投资评审委员会主任、终端BG董事长 @余承东 在朋友圈转发了一...