“天空”模型或引发新一轮AI“军备竞赛”
参考消息
2024-02-21 23:29:18
0

原标题:“天空”模型或引发新一轮AI“军备竞赛”

参考消息网2月21日报道据美国CNET公司网站2月19日报道,美国开放人工智能研究中心(OpenAI)推出了一款名为“天空”(Sora)的文字生成视频模型,它能够提高生成式人工智能创作的可能性。

与众不同

与谷歌推出的文字生成视频工具Lumiere一样,“天空”模型的访问权限是有限的。与Lumiere不同的是,“天空”模型可以生成长达1分钟的视频。

借助“天空”模型的推出,研究人工智能语音生成器的美国十一实验室公司在几天后透露,该公司正在开发为视频提供通过文字生成音效的工具。

随着OpenAI、谷歌、微软等公司将目光投向文字和图像生成之外的领域,寻求巩固其在这个行业中的地位(预计到2032年,该行业的收入将达到1.3万亿美元),并赢得自一年多前ChatGPT问世以来一直对生成式人工智能感兴趣的消费者的青睐,文字生成视频模型在生成式人工智能领域已经掀起了新一轮“军备竞赛”。

根据OpenAI于15日发布的帖子,“天空”模型的访问权限将提供给“安全团队组员”(即在错误信息、仇恨内容和偏见等领域的专家,他们将“通过承担对抗性角色来测试这一模型”)以及视觉艺术家、设计师和电影制作人,以获得来自创作专业人士的额外反馈。这种对抗性测试对于处理可能出现令人信服的“深度伪造”等现象尤为重要,后者是使用人工智能创建图像和视频的一个主要关注点。

除了从组织外部获得反馈外,OpenAI还表示,它希望马上分享这方面的进展,以便“让公众了解未来人工智能将具有哪些能力”。

“天空”模型与众不同的一点是,它能够准确解释长提示——包括一例长达135个单词的提示。OpenAI于15日分享的样本视频显示,“天空”模型可以创建各种角色和场景,从人、动物、毛茸茸的怪物到城市景观、风景、禅意花园,甚至是淹没在水下的纽约市。

模拟世界

这在一定程度上要归功于OpenAI过去在多尔-E和GPT模型方面所做的工作。文本到图像生成器“多尔-E 3”软件于去年9月发布。CNET公司的斯蒂芬·尚克兰称其“比2022年的多尔-E 2提升了一大步”。OpenAI最新的人工智能模型GPT-4 Turbo于去年11月发布。

特别是,“天空”模型借鉴了多尔-E 3的字幕重配技术。OpenAI称该技术可以为视觉训练数据生成“极具描述性的字幕”。

OpenAI的帖子说:“‘天空’模型能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。该模型不仅能够理解用户在提示中所要求的内容,还能理解这些事物在现实世界中是如何存在的。”

OpenAI分享的样本视频看起来确实非常逼真——也许除了近距离出现的人脸或游动的海洋生物外。在其他情况下,你可能很难分辨真假。

该模型还能从静态图像生成视频、扩展现有视频或填充缺失的帧,就像Lumiere所能做的那样。

该帖子还说:“‘天空’模型为那些能够理解和模拟真实世界的模型奠定了基础,我们认为这种能力将成为实现AGI的一个重要里程碑。”

AGI(即通用人工智能)是一种更高级的人工智能,它更接近人类的智能,包括有能力执行更多的任务。元宇宙平台公司和“深层思维”公司也对达到这一基准表现出兴趣。

弱点仍存

OpenAI承认,“天空”模型也有弱点,比如它难以准确描绘复杂场景的物理特性,也难以理解因果关系。

该帖子说:“例如,某人咬了一口饼干,但在后续场景中饼干没有咬痕。”

如果有人需要用手比划出“L”来区分左右,那么他需要注意——“天空”模型也会把左右搞混。

OpenAI没有透露该模型何时会广泛上市,但指出公司希望首先采取“几个重要的安全措施”。这包括满足OpenAI现有的安全标准,即禁止极端暴力、性内容、仇恨图像、名人肖像和他人知识产权。

该帖子还说:“尽管进行了广泛的研究和测试,但我们仍无法预测使用我们的技术会给人们带来的所有裨益,也无法预测滥用这项技术会带来的所有弊端。正因为如此,我们认为随着时间的推移,从现实世界的使用中学习是创建和发布日益安全的人工智能系统的关键要素。”

十一实验室公司19日在一篇博客文章中表示,它使用了诸如“海浪拍打”、“金属撞击”、“鸟鸣”和“赛车引擎”等提示来创建音频,并将这些音频叠加到“天空”模型一些人工智能生成的视频中,以增加效果。

该公司未透露其文本生成声音工具的发布日期,但在博客文章中表示:“大家的兴奋和支持让我们激动不已,我们迫不及待地想把它交到你们手中。”(编译/杨雪蕾)

相关内容

热门资讯

水文水利气象雨量监测:守护水资... 在全球气候变化的大背景下,极端天气事件愈发频繁,水文水利气象雨量监测对于保障水资源合理利用、防范水旱...
固态电池系列深度一:产业化浪潮... 今天分享的是:固态电池系列深度一:产业化浪潮将至,设备领域布局正当时 报告共计:29页 《固态电池系...
北京大学学者Nature发文!... 8月27日 北京大学王兴军教授-舒浩文研究员团队 及香港城市大学王骋教授团队 在Nature上在线发...
6G,大消息!盘中,集体异动! 6G,传来重磅消息! 日前,有消息称,我国科学家近日在6G无线通信领域取得重大突破,成功研制出超宽带...
iPhone“拼好机”即将问世... 当苹果即将揭晓的iPhone 17系列细节逐渐浮出水面,你会发现:安卓与鸿蒙阵营早已普及的旗舰配置,...
应用端推理需求大爆发 全球AS... 来源:财联社 据报道,随着应用端推理需求的大爆发,大厂同步加码定制ASIC芯片以降本稳供成为风潮。近...
精选上网行为管理神器:六款企业... 企业的上网行为管理显得尤为重要,不仅可以保障企业信息安全,还能提高员工工作效率。 市面上有多款优秀的...
行业热议:养老数字化的技术赋能... 8月26日下午,2025人民数据大会“数据要素╳数智养老”平行论坛在深圳举行。在“产业洞察:养老数字...
实时联动 我国首套电碳算协同运... 昨天,我国首套电碳算协同运营系统上线试运行,实现电力、算力与碳排放的实时联动和优化调度,将助力数据中...
原创 星... 今天咱唠唠一个超有意思的研究,和宇宙生命起源有关!科学家在实验室里搞了个大事情,模拟太空极端环境,合...
6000亿寒武纪,可以开香槟了... 文 | 本原财经 5.42亿年前,雪球消融,显生宙初启,地球演化漫长岁月中第一个生命多样性大爆发时...
9月1日起,强制执行!看到可立... 《人工智能生成合成内容标识办法》(以下简称《办法》)将于2025年9月1日开始施行。划重点:接下来,...
原创 王... 上九天揽月,下五洋捉鳖,这句古老的成语如今在现实中有了新的注解。如今的空间站已经实现了完全自主研制,...
宏工科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示宏工科技(301662)新获得一项实用新型专利授权,专利名为“...
滨海新区“一月一链”专利产业化... 近日,滨海新区“一月一链”专利产业化系列推动会——轻工业产业专场活动在滨海—中关村科技园举行。滨海新...
豪鹏科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示豪鹏科技(001283)新获得一项实用新型专利授权,专利名为“...
知乎开源“智能预渲染框架” 几... 近日,知乎在Gitee平台开源了其自研的鸿蒙“智能预渲染框架”,并将该框架的Har包上架到OpenH...
民爆光电获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示民爆光电(301362)新获得一项发明专利授权,专利名为“一种...
轮胎也成了新能源刺客? 这对新鲜出炉的锻造大轮毂,属于刚刚上市的小鹏新一代P7车型的可选配置,直径达到了21寸,轮辐结构基于...
智算“入海” AI大模型催生辽... 【环球网科技报道 记者 郑湘琪】“‘灵龙’,哪片海风浪比较大?请通知可能会受到影响的船只。”近日在青...