星火语音大模型多项指标领先 通用人工智能时代语音王者还是科大讯飞
科技大家谈
2024-02-03 16:48:24
0

原标题:星火语音大模型多项指标领先 通用人工智能时代语音王者还是科大讯飞

2024年开年,国产大模型持续开“卷”。1月30日,科大讯飞在安徽合肥正式举办了星火认知大模型V3.5升级发布会,除了带来星火认知大模型V3.5以外,还首次发布了星火语音大模型,科大讯飞称,星火语音大模型首批37个主流语种已超越OpenAI推出的Whisper V3;在多语种语音合成方面,星火语音大模型的首批40个语种平均MOS分绝对提升0.25,拟人度超83%,在智能语音技术保持国际领先水平。此外,星火语音大模型已深度赋能汽车、客服、陪伴机器人、家庭等更多应用场景,助力千行百业数智化生产力提速。

在发布会上,科大讯飞董事长刘庆峰表示,大模型带来语音技术发展的全新机会。科大讯飞在语音技术上已深耕二十余年,多年来在语音识别、语音合成等多领域始终保持源头技术创新迭代,并斩获大量国际权威赛事冠军。比如语音识别技术方面,科大讯飞蝉联多届国际多通道语音分离与识别大赛CHiME冠军,语音合成技术方面,科大讯飞获国际语音合成大赛Blizzard Challenge十四连冠。在国内,科大讯飞还是首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心的承建方,被誉为语音技术与AI领域的“国家队”。

“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们的目标和梦想一天都没有变。”在通用人工智能时代,科大讯飞也紧抓大模型时代机遇,星火语音大模型的发布不止助力无障碍沟通,还能“百搭”更多场景,赋能实际应用,带来产业和人类生活的革新。

在技术优势上,借助大模型底座与国产算力平台,讯飞星火语音大模型将更多语音表征解耦,并融入到大模型预训练中,提升了韵律表现力和拟人度,突破了复杂场景识别效果的上限,提升了语料稀缺小语种的效果。刘庆峰表示:“借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”

为了让星火语音大模型深度赋能千行百业,科大讯飞还率先将星火语音大模型用在自有C端硬件产品上。根据刘庆峰介绍,搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。升级后的多语种自动识别将支持35种语言,兼具增强式翻译技术提供中英双语服务。发布会现场还展示了一段对日本人、法国人与俄罗斯人的街头采访视频,生动展现出讯飞翻译机在多语种自动识别让国际沟通更便捷的真实写照,为不同国家人种的跨语言沟通提质增效,升级后的翻译机化身随身AI翻译助手,获现场及线上观众“点赞”。

除了赋能C端硬件产品,在行业端,星火语音大模型还深度赋能汽车、客服、家庭、陪伴机器人等实际应用场景,带来更深层次的人机交互变革。比如赋能汽车智能座舱、智能导航和音乐控制等交互体验更智慧快捷、赋能陪伴机器人、导购机器人和辅诊机器人在各自领域发挥重要作用,加速机器人产业的革新;赋能穿戴式设备等产品拥有更自然的语音交互能力。对于千行百业而言,星火语音大模型可以组成“百搭”CP,切实解决实际应用过程中的痛点,赋予产业变革更多的可能性。

正如刘庆峰所说:“当年从DOS界面到Windows界面成就了微软的传奇,从键盘到触摸诞生了苹果的神画,我觉得这一次全语音的自然交互一定会推动整个产业出现新一次的繁荣。”科大讯飞星火语音大模型的发布,带来了人机交互新变革,也再次夯实通用人工智能时代科大讯飞语音王者地位。

相关内容

热门资讯

社交-交易-AI,如何理解腾讯... 腾讯正站在AI变现的新起点,微信生态的社交-交易-AI深度融合,有望为公司带来千亿级别的增量收入和盈...
深化产学研融合,金塑宝搭建实验... 实验室里,科研人员专注于攻克技术难关,但成果却受限于诸多因素难以落地;生产线旁,技术工人与工程师们紧...
金沙江创投朱啸虎:“下一个字节... 红星资本局9月11日消息 今日外滩大会开幕式上,金沙江创投主管合伙人朱啸虎给出了一个观点,他认为AI...
原创 苹... 苹果发布会今天凌晨落幕,发了8款新品,iPhone外观是近几年变化最大的一次,这点就好在没人看不出来...
【数智化CIO展】美的集团CI... 刘向阳 企业核心竞争力在于能力和效率。能力主要靠研发,效率主要靠数智化。效率是为企业保命的,因为护城...
培养更多数字技能人才赋能产业转... 当前,随着人工智能技术的飞速发展,天津这座工业老城也在向数字化、智能化转型,需要大批高素质数字技能人...
观察|AI产业爆发!今年外滩大... “Flowith在去年8月发布时,市场上同类Agent产品不足20款,今年仅仅8月就新增超过50款,...
“2025年全国科普月”系列活... 根据新修订的《中华人民共和国科学技术普及法》,今年9月是我国首个全国科普月,为更好地发挥科普阵地服务...
荣耀高管点评iPhone 17... 2025年9月10日,苹果秋季发布会推出的iPhone 17系列引发广泛关注。荣耀终端股份有限公司品...
聊得来日常,救得了危局!外滩大... 大秀厨艺、按摩推拿、打鼓奏乐、调制鸡尾酒……走进外滩大会的“机器人小镇”,各类机器人各显神通。从生活...
世优合作丨绽优科技亮相98投洽... 2025年9月8日至11日,第二十五届中国国际投资贸易洽谈会(简称“98投洽会”)在厦门隆重举行。作...
高通钱堃:助力中国合作伙伴通过... 9月11日-12日,由知识产权出版社主办的第十四届中国知识产权年会在北京举办。本届年会以“数字时代的...
2025服贸会丨自研芯片打破海... 作为全球服务贸易领域的年度盛会,2025年中国国际服务贸易交易会(以下简称“服贸会”)也成为医疗科技...
产业互联网平台开发公司|数商云... 在数字经济与实体经济深度融合的背景下,产业互联网正成为推动传统产业转型升级的核心引擎。作为国内领先的...
售价近千元!又一大厂推出UWB... 自雷蛇在2021年推出Viper 8K鼠标后,市场上出现了不少声称可通过2.4GHz连接提供8K轮询...
iPhone 17橙色风暴来袭... 你还在用着厚重的手机吗?你还在为千篇一律的黑白灰配色感到无聊吗?苹果这次真的放大招了!iPhone ...
iPhone 17打价格战,苹... 创新不够,诚意来凑 撰文/ 孟会缘 编辑/ 李觐麟 排版/ Annalee 今年由苹果举办的“科技春...
用国产GPU训练的国产大模型来... 智东西 作者 | 陈骏达 编辑 | 心缘 智东西9月10日报道,9月5日,中国科学院自动化研究所发布...
“空中120”为生命架起云端高... □本报记者 李晓敏 9月9日,全国首架C909医疗机在郑州正式交付。这不仅为河南,也为全国医疗救援体...
科研与产业成果双向赋能光电领域 显微高光谱成像仪。 基于拉曼光谱技术的LNG组分在线检测系统。(图片均由受访单位提供) ■记者 关...