计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态
创始人
2025-12-29 00:41:14

今天分享的是:计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石

报告共计:23页

GenAI领域技术迭代与生态拓展总结

当前GenAI领域竞争重心正从商业模式转向底层硬科技实力,头部企业凭借长期技术积累与生态整合,推动行业快速发展,其中火山引擎豆包大模型与阿里千问APP的最新动态尤为引人注目。

火山引擎在FORCE原动力大会上发布多款升级产品,豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度实现显著增强,其多模态理解与智能体执行力已与Qwen3比肩,在数学推理、长视频解析及文档图表理解等核心场景表现突出。视频生成模型Seedance 1.5 Pro凭借“声画一体”原生架构,在音频质量、同步性及表现力等方面优于同类产品,Draft样片功能可提升创作效率65%。此外,图像创作模型Seedream 4.5和语音识别模型2.0进一步丰富了豆包模型家族,语音识别的上下文关键词召回率提升20%,还支持多模态视觉识别。截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较9月大幅增长,在单位推理成本降低的趋势下,商业化路径逐渐清晰。

阿里千问APP公测后表现亮眼,上线23天月活用户即突破3000万,其核心进展是正式接入高德地图,实现从“理解用户意图”到“执行具体服务”的跨越。借助高德的实时路况、扫街榜等数据,千问APP可智能规划出行路线、推荐餐厅,支持多需求协同处理。实测显示,在出行游玩路线规划、路线时长估计和周边餐厅推荐等场景中,千问APP能提供结构化答案、实时数据支撑及可直接执行的操作链接,实用性突出。这种通过APP授权整合服务的模式,为后续接入淘宝、飞猪等更多阿里系应用奠定了基础,有望构建覆盖多元场景的超级Agent生态。

整体来看,GenAI行业正呈现技术迭代加速、生态整合深化的趋势。大模型的发展愈发依赖基础研究积累、算力工程能力和算法创新,头部企业通过持续的产品升级与场景拓展,不断强化核心竞争力,推动AI技术从信息交互向现实世界服务执行深度渗透。

以下为报告节选内容

相关内容

热门资讯

实景实训专项行动启动 人形机器... 本报记者 丁蓉 近日,工业和信息化部办公厅、国务院国资委办公厅发布的《关于联合开展2026年度人形机...
艾晨数能ACT系列UPS 作为国内模块化UPS及数字能源解决方案领域的重要厂商,艾晨数能长期专注于超大功率模块化UPS、数据中...
从C端全屋智能到B端算力基建,... 6月10日,南都湾财社记者从美的集团获悉,美的集团与阿里巴巴集团正式签署战略合作协议。双方将依托各自...
无人驾驶自动投喂船“粤坡渔养1... (来源:中国水运网) 转自:中国水运网 6月8日,全国首艘大型无人驾驶自动投喂船“粤坡渔养10001...
WATCH GT 6 Pro为... 后台很多朋友把预算卡在两三千这个档位,嘴上问"有没有必要上Pro",心里其实怕的是:花了钱,结果手表...