免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI
钛媒体APP
2024-02-13 09:16:26
0

原标题:免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI

图片来源:unsplash

近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。

今天,钛媒体AGI梳理了免费 AI “神器”系列第三弹,共五款,其中大多数实用工具能帮你提升一定的生产力。

  • AI视频编辑神器——Runway Gen-2
  • 胸部x光片诊断神器——CheXagent
  • AlphaZero升级版——DeepMind下象棋模型
  • Vision Arena:视觉模型盲测工具
  • 图片3D转换器——ComfyUI 3D Pack
1、AI 视频编辑神器——Runway Gen-2

产品信息:Runway Gen-2是一款功能强大的AI视频编辑软件,用户可以直接使用“文本”、“图片”和“文本+图片”三种方式提示生成视频内容,并自动剪辑视频。

产品功能:用户在主界面可自由选择“文本”、“图片”和“文本+图片”三种方式来生成视频内容。以“文本”生成视频为例,在输入框输入一段描述词后,等待两分钟左右就会生成一段4秒的视频内容。

除此之外,Runway Gen-2还配备有其他30种强大的 AI 工具,比如:“Remove Background”(绿幕去背景)、“Expand Image”(图片扩展)、“Blur Faces”(模糊人脸)、“Inpainting”(移除视频杂物/人)等,可以帮助视频内容创作者极大提高工作效率。

Runway Gen-2配备有30种 AI 功能

据悉,Runway Gen-2背后的开发团队来自Runway公司,他们致力于开发用于生成视频、图像和多媒体内容的产品和模型。在2023年6月,该公司以15亿美元的估值,完成了1.41亿美元的C轮融资,谷歌、英伟达等科技巨头都参与了投资,被誉为“AI 视频生成领域的字节跳动”。

Runway Gen-2首席执行官Cristobal Valenzuela曾表示,“创意软件的时代已经结束。”而有科技博主认为:“如果(Runway)按照这个速度发展下去,到2024年底,我们或许能够看到导演们手工制作出好莱坞水准的生成式视频作品。”

体验链接:https://app.runwayml.com/

2、胸部x光片诊断神器——CheXagent

产品信息:CheXagent是一个专门用来解读胸部x光片的AI模型,旨在提高医疗影像诊断效率与准确性。

产品功能:用户只需在CheXagent主界面上传一张胸部x光片,等待数秒后即可生成相关的诊断结果,包括疾病识别、异常检测、重要结构分析以及后续步骤建议。

CheXagent 界面

CheXagent由斯坦福大学与Stability AI合作开发,结合了临床医学大语言模型、视觉编码器和视觉-语言桥接网络,利用超过600万组数据的大型集合进行训练,提升了解读X光图像的能力。如若未来进入大规模应用,医疗工作者的工作效率和诊断准确率都将得到提升。

体验链接:https://stanford-aimi.github.io/chexagent.html

3、AlphaZero升级版——DeepMind下象棋模型

产品信息:Google DeepMind抛弃传统的搜索方法,使用Transformer模型,训练了一个AI模型来下国际象棋。

产品功能:Google DeepMind下象棋模型使用了一个国际象棋程序Stockfish 16来训练,AI不再需要像此前普通 AI 国际象棋依赖于搜索算法来预测和评估最佳选择的走法,而是直接学习成千上万棋局中的模式和策略,达到只需通过观察当前棋盘的状态,做出高水平决策的大师级棋艺。

DeepMind下象棋模型相关论文

该模型在性能上超越了AlphaGo Zero和GPT-3.5-Turbo-Instruct,证明了深度学习模型,特别是Transformer模型,能够在复杂的决策和策略游戏中学习和模拟高级人类智能,显著减少了计算需求,为AI的自主学习和理解复杂系统提供了新的范例。

与AI下棋体验地址:https://lichess.org/

4、Vision Arena:视觉模型盲测工具

产品信息:Vision Arena是一款视觉模型领域的开放评测对比平台,目的是测试和比较不同的视觉语言模型(VLMs),比如GPT-4V、Gemini(谷歌模型)、Llava、Qwen-VL(通义模型)等。

产品功能:用户可以在Vision Arena工具上同时测试两个视觉模型,并对它们进行投票,以决定哪个更优秀。而且整个过程处于“盲测”状态,需要选择你认为好的结果才会告诉你模型是什么。

据透露,这是全球首个GPT-4V的盲测工具软件。未来,基于该工具的模型基准排行榜(Elo Rating)功能也将推出。

体验地址:https://huggingface.co/spaces/WildVision/vision-arena

5、图片3D转换器——ComfyUI 3D Pack

产品信息:ComfyUI 是一款基于稳定扩散模型(Stable Diffusion Model)架构技术,直观、功能强大且实现模块化的图形平台,允许用户创建复杂的 AI 文生图工作,无需编程知识。

产品功能:今年1月,ComfyUI 宣布引入3D图像处理模型,能快速将图片转换成3D模型。如今,用户可在ComfyUI 3D Pack平台上将图片快速转换成一个3D模型,并能从不同角度查看该3D模型,还能使用3D高斯扩散技术提升模型质量,让3D模型看起来更加真实和具有立体感。此外,ComfyUI 3D Pack还支持多种格式导出,集成了先进的3D处理算法。

ComfyUI 3D Pack界面

体验地址:https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main

(本文首发钛媒体App,作者|任颖文,编辑|林志佳)

相关内容

热门资讯

专业化群演招募培训 电影梦不再... 你是否曾经在观看电影时,内心涌动着强烈的渴望,幻想自己也能置身于那光影交织的奇妙世界,演绎别样人生?...
原创 成... 当今时代,信息如大海般汹涌而来,表面热闹非凡,却常让人眼花缭乱。当很多人满足于追逐表面的信息潮流时,...
工信部副部长熊继军:切实提升算... 8月23日,以“算网筑基 智引未来”为主题的2025中国算力大会在山西省大同市开幕。工业和信息化部副...
南昌市智慧阅读实践经验在全球智... 8月18-20日,2025年全球智慧教育大会在北京师范大学举行。南昌市教育评估监测和技术推广中心党委...
华为云组织架构大调整! 2025年8月22日,华为云迎来了一次具有深远意义的组织架构调整,华为云CEO张平安通过内部发文正式...
视频产业的创意活力,被百度蒸汽... 1776 年,瓦特改良蒸汽机,将传统手工作坊转化为规模化生产的工厂,蒸汽机由此成为工业革命的动力心脏...
原创 v... 同一个品牌旗下免不了会出现搭载相同处理器的机型,而这类机型又免不了会被进行对比,其中性价比较低的机型...
真我15000mAh手机曝光,... 今年5月,realme 真我官方在海外官宣了一款概念手机,该机的电池容量达到了 10000mAh。 ...
我国又一“科考利器” 成功海试... 本文转自【新华视点】; 新华全媒+|我国自主研制的6000米级深海无人遥控潜水器“海琴”号在南海成功...
天河企业组团亮相广博会,输出“... 南方财经记者魏彤 广州报道 “大家好,我是高擎机电的小海,很高兴参加第33届广州博览会。” 8月22...
中弘源泽建设取得喷涂施工用平台... 金融界2025年8月23日消息,国家知识产权局信息显示,中弘源泽建设有限公司取得一项名为“一种喷涂施...
“星舰”第十次试飞 成功与否明... 美国太空探索技术公司新一代重型运载火箭“星舰”拟于当地时间24日傍晚(北京时间25日早晨)展开第十次...
数智改变生活|数智普惠!算家计... 当AI计算的门槛被悄然打破,当1.24元就能体验到RTX 4090的超强算力,数智化的浪潮正以前所未...
江南文化style⑩ | 没有... 编者按:在这个快节奏的时代,你是否幻想过穿越回千年前,体验古人那雅致细腻的生活美学?浙江在线的“AI...
AI赋能智能家居加速创新 香江... 来源:市场资讯 (来源:证券时报) AI、云计算、物联网等技术赋能下,智能家居行业创新提速。日前举行...
中国科技馆举办科学之夜预热全国... 中新网北京8月24日电 (记者 孙自法)中国科技馆8月24日向媒体发布信息说,作为2025年全国科普...
应对遗传瓶颈 北京首次开展境外... 麋鹿作为我国特有物种,经历了从繁盛到本土灭绝的沧桑历程。40年前的8月24日,22只麋鹿从英国重回北...
治理算法滥用,核心在于“算法透... 近年来,算法滥用事件频发,这些事件不断提醒我们:打开“算法黑箱”已成为数字时代必须面对的核心议题。 ...
新华全媒+|我国自主研制的60... 8月23日清晨,在南海飘着小雨的蓝色晨曦中,我国自主研制的6000米级深海无人遥控潜水器(ROV)“...
联想副总裁陈振宽:打造多元AI... 本报讯 (记者贾丽)8月23日,2025中国算力大会在山西大同举办。联想集团有限公司(以下简称“联想...