OpenAI押注音频技术,硅谷掀起无屏设备竞争
创始人
2026-01-06 13:20:43

OpenAI正在大力押注音频AI技术,这不仅仅是为了让ChatGPT听起来更好。据The Information最新报道,该公司在过去两个月中整合了多个工程、产品和研究团队来全面升级其音频模型,为预计在一年后推出的音频优先个人设备做准备。

这一举措反映了整个科技行业的发展方向——朝着屏幕成为背景噪音、音频成为核心的未来迈进。智能音箱已经让语音助手成为超过三分之一美国家庭的固定设备。Meta刚刚为其Ray-Ban智能眼镜推出了一项功能,使用五麦克风阵列帮助用户在嘈杂环境中听清对话——本质上是将你的面部变成定向监听设备。与此同时,谷歌从6月开始试验"音频概览"功能,将搜索结果转换为对话式摘要,特斯拉则将xAI的聊天机器人Grok集成到其车辆中,创建一个通过自然对话处理从导航到气候控制等一切功能的对话式语音助手。

不仅仅是科技巨头在做这样的押注。一群各具特色的初创公司也怀着同样的信念出现,尽管成功程度各不相同。Humane AI Pin的制造商在他们的无屏可穿戴设备成为警示故事之前已经烧掉了数亿美元。Friend AI吊坠声称能记录你的生活并提供陪伴,引发了隐私担忧和存在焦虑。现在至少有两家公司,包括Sandbar和由Pebble创始人Eric Migicovsky领导的公司,正在开发预计2026年推出的AI戒指,让佩戴者真正可以对手说话。

形态因素可能不同,但观点是相同的:音频是未来的界面。每个空间——你的家、你的汽车,甚至你的脸——都在成为控制表面。

OpenAI计划于2026年初推出的新音频模型据报道将听起来更自然,能像真正的对话伙伴一样处理打断,甚至能在你说话时同时说话,这是目前模型无法做到的。该公司还被认为设想了一系列设备,可能包括眼镜或无屏智能音箱,它们更像伙伴而不是工具。

这些都不太令人惊讶。正如The Information指出的,前苹果设计主管Jony Ive通过该公司5月份65亿美元收购其公司io而加入了OpenAI的硬件工作,他将减少设备成瘾作为优先事项,认为音频优先设计是"纠正"过去消费电子产品"错误"的机会。

Q&A

Q1:OpenAI的新音频模型有什么特别之处?

A:OpenAI计划于2026年初推出的新音频模型将听起来更自然,能像真正的对话伙伴一样处理打断,甚至能在用户说话时同时说话,这是目前模型无法做到的功能。

Q2:为什么科技公司都在发展音频技术?

A:整个科技行业正朝着屏幕成为背景噪音、音频成为核心的未来发展。音频被认为是未来的界面,每个空间都在成为控制表面,能提供更自然的交互体验。

Q3:除了OpenAI,还有哪些公司在开发音频设备

A:Meta为Ray-Ban智能眼镜添加了五麦克风阵列功能,谷歌推出音频概览功能,特斯拉集成xAI的Grok聊天机器人,还有多家初创公司如Sandbar等正在开发AI戒指等音频设备。

相关内容

热门资讯

英脉智能取得安全带开关控制器胶... 国家知识产权局信息显示,苏州英脉智能设备有限公司取得一项名为“一种安全带开关控制器胶套组装机构”的专...
超全攻略:2025年最新手机号... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
算力赋能 打造生命科学云上新范... 云端算力驱动生命科学创新,实现百万样本高效分析 某生命科学研究院推出的生命科学数据分析平台,是一款基...
曝联发科天玑9500s对标骁龙... IT之家 1 月 12 日消息,博主 @数码闲聊站 今天在微博透露,联发科天玑 9500s 芯片在配...
字节跳动出手,自变量机器人完成... 1月12日,自变量机器人宣布已于近期完成10亿元A++轮融资。本轮融资由字节跳动、红杉中国、北京信息...