如何在AI赋能中平衡创新与挑战?巢文涵:从训练和创造AI走向调用和激发AI潜力
每日经济新闻
2024-03-17 20:37:32
0

原标题:如何在AI赋能中平衡创新与挑战?巢文涵:从训练和创造AI走向调用和激发AI潜力

每经记者:王郁彪 每经编辑:文多

北京航空航天大学计算机学院副教授巢文涵进行主旨演讲 图片来源:每经记者 韩阳 摄

AI大潮汹涌,真实与虚拟,正在被无限模糊。2024开年,OpenAI用它的首个视频生成模型Sora宣告了一个AI新阶段的到来——仅凭简单的文字描述,便可深度模拟真实物理世界,生成最长60秒的拟真视频。

如果把AI比作刚出生的婴儿,大语言模型的诞生则意味着它开口讲话,Sora的面世相当于他/她睁开了双眼,并把自己观察到的一切转化为画面与声音。

随着AI技术的不断发展与应用,在AI赋能的过程中,该如何平衡其中的创新与挑战?

3月15日,由工业和信息化部工业文化发展中心牵头成立的AI应用工作组主办,每日经济新闻承办、数智未来场景实验室协办的“Sora的启示:AI应用再飞跃”主题沙龙活动在京成功举办。

北京航空航天大学计算机学院副教授巢文涵在主旨演讲环节表示:生成式AI的迭代速度降低了用户端的再训练必要性,因此,想要在生成式AI的应用中寻求进一步突破,应该从训练和创造AI,逐渐走向调用和激发AI潜力。

重新认识Sora——“世界模拟器”

当其他AI视频工具还在突破几秒内的连贯性时,Sora已经可以快速制作最长1分钟、准确反映用户提示、可一镜到底的视频。

对于Sora在技术上的突破,巢文涵认为,Sora实际上是一个“Diffusion+Transformer模型”(Diffusion、Transformer分别为模型名称),是二者组合成的强大信息提取器。

此外,他还表示,Sora继承了Dall-E3(OpenAI开发的最新文本到图像转换工具)的画质和遵循指令的能力,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。

因其根据静态图像生成视频的能力,Sora在动图制作、广告设计等领域具有不小的应用前景。不过,巢文涵还补充说,Sora能够获取现有视频并对其进行扩展或填充缺失的帧,这一功能在视频编辑、电影特效等领域也将有不俗的应用表现。

值得一提的是,用户还可以使用Sora连接两个输入视频,在完全不同的主题和场景组成的视频间,实现无缝过渡。

Sora在技术上的突破及其未来广阔的应用前景,使得AI又上升到了一个全新的维度。“Sora虽被定义为一款人工智能文生视频大模型,但其实,OpenAI并未将其单纯视为视频模型,而是作为‘世界模拟器’。”巢文涵如此表示。

北京航空航天大学计算机学院副教授巢文涵 图片来源:每经记者 韩阳 摄

从训练和创造AI,走向调用和激发AI潜力

从时尚展示到动漫制作,从心理治疗到建筑规划,Sora可以为多个相关领域进行全新的创造、再创造。不过,巢文涵认为,Sora同样拥有诸多局限性。

比如,Sora在处理复杂场景时对物理规则的应用不一致,因此出现无法准确模拟出因果关系的特定情况。这也可以解释,为什么在Sora生成的视频里,时常能看到变形的椅子飞向天空的画面。

巢文涵进一步补充说,在人机交互、充分理解空间和时间的复杂性以及使用限制上,Sora还有非常多的局限性。

那么,如何在AI技术不断突破的过程中,继续逐点击破AI赋能和应用的难点,平衡创新与挑战?巢文涵表示,生成式AI应用,应该从训练和创造AI,走向调用和激发AI潜力。

“生成式AI的迭代速度降低了用户端的再训练必要性,关键是用户怎么调用这些生成式AI。同时,大模型本身外部检索、多模态能力都非常强,本身是一个好的搜索入口。”他接着补充说,“应该进一步去App化,提供更多维度的综合应用交互方式。”

在巢文涵看来,大模型本身具备生态插件及融合能力,其自身会调用服务接口,不需要打开App,而是需要设计合理的API(应用程序编程接口)接口。此外,还需打破传统AI应用中语音、文字、图片等不同格式内容的界限,提供更多维度的综合应用交互方式。

从技术层面考量,Sora也面临着一系列挑战,包括可扩展性和计算资源、隐私和伦理问题以及就业和社会变革等。这些挑战中,巢文涵特别提到了深度伪造。他注意到,不法分子会利用机器的深度学习技术,进行图像、声音、视频的篡改、伪造和自动生成,产生高度逼真且难以甄别的内容。

巢文涵认为,Sora对社会生产力和产业发展的促进作用毋庸置疑,但同时,Sora创造的大量虚拟视频会污染现存的图像数据,引发一系列问题。

因此,他建议,应该建立法律和监管框架,同时提供政策支持,增强创新意识,加强数据保护与安全。

每日经济新闻

相关内容

热门资讯

英伟达回应芯片售罄传闻:可实时... 【CNMO科技消息】近日,有关英伟达高端AI芯片H100/H200供应紧张甚至"售罄"的传闻在市场上...
我国科学家揭示植物基因起源新机... 长期以来,科学界普遍认为,新基因是通过错误复制、融合或拆分已存在的基因而产生的。然而,我国科学家经过...
Hi财经丨多地竞逐“未来产业”... 来源:海外网 来源:海外网 从AI智能体的迭代升级,到深海探测技术在部分领域领跑,再到新能源汽车的规...
岚图知音上市:卢放自信宣称,打... 在成都车展的前夜,岚图汽车携手华为,正式推出了全新岚图知音,这款家用纯电SUV以20.29万至24....
深圳正在吸引无人机新势力 深圳无人机灯光秀(羊城晚报资料图) 影翎全景无人机 图/受访者...
8月全球人工智能领域新看点 来源:铜川日报 刚刚过去的8月,全球人工智能(AI)领域在模型迭代方面继续加速,在应用场景方面更加多...
原创 风... 1. IPO时间表公布,四季度揭晓核心数据 宇树科技于9月2日通过社交媒体宣布,计划在2025年1...
长川科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示长川科技(300604)新获得一项实用新型专利授权,专利名为“...
机构预测iPhone 17系列... 摩根大通公布了苹果iPhone 17系列手机的定价分析,相较于其他机构一致看涨的分析,摩根大通的预测...
视觉中国完成旗下网站AIGC标... 视觉中国宣布已完成旗下网站 vcg.com、cfp.cn 的升级,对所有 AI 生成合成内容依法进行...
2025年智能手表怎么选?这两... 嘿,2025年这科技发展得跟坐火箭似的,智能手表市场那叫一个热闹非凡,就像一场盛大的狂欢派对!各种功...
从″人工智能+″政策看未来十年... 来源:天舜企业AI智能协同机器人 2024年,“人工智能+”行动首次被写入政府工作报告。2025年政...
谷歌重大胜利!法院裁决不必出售... 美国联邦法官裁决,谷歌可以保留其Chrome浏览器,但将被禁止签署独家合约并必须共享搜索数据。 周二...
玩转中阿博览会:中东大佬来华掘... 来源:@CGTNGlobalBusiness微博 【玩转中阿博览会:中东大佬来华掘金AI】#中阿博览...
大众点评“救火”美团 作者 | 叶二 编辑 | 魏晓 当护城河即将被攻破之际,美团又打起了大众点评的主意。 8月23日,大...
AI热潮中美国电力公司也有苦恼... 尽管在过去一年多的时间里,有关“AI尽头是电力”的说法早已在业内广为流传。不过对于有望在这轮AI热潮...
3.3万吨钢材加工七成由机器人... 8月28日,藻渡水库大坝智慧控制中心,工作人员在对总长94.24公里的施工现场进行远程监控。记者 罗...
AI生成内容不得“隐身”传播 本报记者 袁璐 AI生成内容不得“隐身”传播。昨天,国家网信办等四部门联合发布的《人工智能生成合成内...
原创 重... 家人们,最近科学界又有个超级重磅的消息!科学家们搞出了一个新型 AI 模型,居然能精准预测致病基因突...
成研院空天地无人机应急通信系统... 在近日于石河子举行的第二届低空产业创新发展大会上,一场关于低空经济及通用航空领域的深度对话拉开帷幕,...