AI高质量数据短缺预警?乌镇峰会首发AIGD平台破解难题
创始人
2024-11-20 02:20:46

潮新闻客户端 记者 张云山 柳蓬

11月19日下午,在2024年世界互联网大会乌镇峰会上,行业大模型、具身智能等领域的10项首发成果精彩亮相,其中AI数据合成与生产平台AIGD(AI Generated Data)凭借其在数据合成领域的创新技术,吸引了广泛关注。

蚂蚁数科AI科技技术负责人、蚂蚁天玑实验室主任李哲

随着AI技术的快速发展,高质量数据已成为AI应用深入产业的重要基础。然而,据Epoch AI Research研究团队预测,到2026年,现存用于AI模型训练的高质量语言数据将面临耗尽的困境。在此背景下,数据合成技术显得尤为重要。 蚂蚁数科AI科技技术负责人、蚂蚁天玑实验室主任李哲在峰会上表示,未来的AI应用将需要大量稀缺且难以获取的长尾数据,如自动驾驶中的极端天气与路况数据,以及具身智能所需的复杂场景数据。AIGD平台的推出,正是为了应对这一挑战。

AIGD平台具备PB级数据生产能力,支持从数据生成到训练的全流程自动化处理,自动化率高达80%。平台自研了15余种数据合成工具,能够合成图片、视频、3D模型等多模态数据,满足多种应用场景下的AI模型训练需求。 业内人士认为,AIGD平台的出现,将有效缓解高质量数据短缺的问题,推动AI技术深入千行百业。据Gartner预测,到2030年,合成数据将成为AI模型的主要训练数据来源;2024年,60%的AI数据将是合成数据。 此外,AIGD平台还具备数据标注和质检能力。通过人机协同标注,预标注模型依赖人工标注量降低了70%以上。在数据质检方面,平台会根据元信息支持不同粒度的数据质量统计,确保合成及标注后的数据符合预期质量要求。 蚂蚁数科今年陆续发布了多款AI产品,包括大模型安全评测与防御产品“蚁天鉴”、反深伪造产品ZOLOZ Deeper等。作为一家面向ToB服务的科技公司,蚂蚁数科将继续坚定在AI ToB领域的投入,推动AI服务产业的黄金年代到来。 此次乌镇峰会上,AIGD平台的亮相不仅展示了蚂蚁数科在AI数据合成领域的创新能力,也为解决AI高质量数据短缺问题提供了新的思路和解决方案。

“转载请注明出处”

相关内容

热门资讯

一加3安卓系统耗电,深度剖析电... 最近是不是发现你的手机一加3在用安卓系统的时候,电量消耗得特别快?别急,今天就来给你好好分析分析这个...
安卓手机root基带升级系统,... 你有没有想过,你的安卓手机其实还有隐藏的潜能?没错,就是那个神秘的root权限!今天,就让我带你一探...
华夏方舟安卓系统密码,解锁数字... 你有没有想过,手机里的那些神秘密码,就像是守护着我们的私人宝藏呢?今天,就让我带你一探究竟,揭开华夏...
安卓系统底层搭建教程 想要深入了解安卓系统的底层搭建吗?那就跟着我一起,揭开这神秘面纱的一角吧!在这个数字化时代,安卓系统...
用qt开发安卓系统,基于Qt的... 你有没有想过,用Qt开发安卓系统竟然可以这样酷炫?没错,就是那个我们平时用来开发桌面应用程序的Qt,...