OpenAI押注音频技术,硅谷掀起无屏设备竞争
创始人
2026-01-06 13:20:43

OpenAI正在大力押注音频AI技术,这不仅仅是为了让ChatGPT听起来更好。据The Information最新报道,该公司在过去两个月中整合了多个工程、产品和研究团队来全面升级其音频模型,为预计在一年后推出的音频优先个人设备做准备。

这一举措反映了整个科技行业的发展方向——朝着屏幕成为背景噪音、音频成为核心的未来迈进。智能音箱已经让语音助手成为超过三分之一美国家庭的固定设备。Meta刚刚为其Ray-Ban智能眼镜推出了一项功能,使用五麦克风阵列帮助用户在嘈杂环境中听清对话——本质上是将你的面部变成定向监听设备。与此同时,谷歌从6月开始试验"音频概览"功能,将搜索结果转换为对话式摘要,特斯拉则将xAI的聊天机器人Grok集成到其车辆中,创建一个通过自然对话处理从导航到气候控制等一切功能的对话式语音助手。

不仅仅是科技巨头在做这样的押注。一群各具特色的初创公司也怀着同样的信念出现,尽管成功程度各不相同。Humane AI Pin的制造商在他们的无屏可穿戴设备成为警示故事之前已经烧掉了数亿美元。Friend AI吊坠声称能记录你的生活并提供陪伴,引发了隐私担忧和存在焦虑。现在至少有两家公司,包括Sandbar和由Pebble创始人Eric Migicovsky领导的公司,正在开发预计2026年推出的AI戒指,让佩戴者真正可以对手说话。

形态因素可能不同,但观点是相同的:音频是未来的界面。每个空间——你的家、你的汽车,甚至你的脸——都在成为控制表面。

OpenAI计划于2026年初推出的新音频模型据报道将听起来更自然,能像真正的对话伙伴一样处理打断,甚至能在你说话时同时说话,这是目前模型无法做到的。该公司还被认为设想了一系列设备,可能包括眼镜或无屏智能音箱,它们更像伙伴而不是工具。

这些都不太令人惊讶。正如The Information指出的,前苹果设计主管Jony Ive通过该公司5月份65亿美元收购其公司io而加入了OpenAI的硬件工作,他将减少设备成瘾作为优先事项,认为音频优先设计是"纠正"过去消费电子产品"错误"的机会。

Q&A

Q1:OpenAI的新音频模型有什么特别之处?

A:OpenAI计划于2026年初推出的新音频模型将听起来更自然,能像真正的对话伙伴一样处理打断,甚至能在用户说话时同时说话,这是目前模型无法做到的功能。

Q2:为什么科技公司都在发展音频技术?

A:整个科技行业正朝着屏幕成为背景噪音、音频成为核心的未来发展。音频被认为是未来的界面,每个空间都在成为控制表面,能提供更自然的交互体验。

Q3:除了OpenAI,还有哪些公司在开发音频设备

A:Meta为Ray-Ban智能眼镜添加了五麦克风阵列功能,谷歌推出音频概览功能,特斯拉集成xAI的Grok聊天机器人,还有多家初创公司如Sandbar等正在开发AI戒指等音频设备。

相关内容

热门资讯

锐石创芯:突破高端射频前端全链... 在全球半导体产业链中,射频前端一直被认为是技术门槛最高、国产化难度最大的细分赛道之一。 作为无线通信...
2026年二手苹果MacBoo... 在如今这个数字化办公时代,一台性能强劲的笔记本电脑已成为职场人士的刚需。苹果MacBook系列凭借出...
世界最大轴对称太阳望远镜在稻城... 近日,记者从甘孜州稻城高海拔天文科学中心获悉,位于稻城县无名山海拔4700米处的“2.5米大视场高分...
原创 意... 欧洲将首次派出自己的宇航员参与美国国家航空航天局(NASA)的月球计划,但出人意料的是, 德国人并未...
苹果笔记本上岛!MacBook... 快科技6月10日消息,2021年为了进一步提升屏占比,苹果在MacBook Pro产品线正式引入了刘...