近日,蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。该基地作为苏州市首个AI数据产业基地,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。
数据被视为AI学习的核心教材。然而,AI在工业等复杂场景落地时,常面临行业知识匮乏、高质量数据稀缺等瓶颈,急需专业人才参与建设。专业的AI数据标注师,被誉为“AI教官”,他们通过精确标注和修正,确保训练数据准确、无偏见,以此提升模型输出的安全性与可靠性,并持续“教导”AI理解语义、更通人情。
赵秋燕是某财经大学金融学本科毕业,曾从事会计工作,擅长纠正AI回答的金融问题。学法律的严冯娜,主要工作是标注大模型输出文字中涉及的“红线”问题,教AI“什么能说,什么不能说”。标注师李宁曾经是个美术老师,他需要面对大量图片数据,标注其中的“内容风险”。医学、外语、旅游等领域的专业人才也正加入各垂类模型的数据标注工作。
“蚂蚁数科AI标注师队伍的平均学历在本科以上,太仓政府在园区建设、人才招募、生态企业入驻等方面提供了强力支持。”蚂蚁数科AI科技事业部总经理张凯介绍,蚂蚁数科已与江苏多所高校开展产教融合、孵化AI实战人才。按计划,基地未来将扩展至300人规模。
技术层面,蚂蚁数科自研的AI数据标注平台可智能推荐标注内容、自动补全标签,结合自动化质检与人工抽检双重保障数据质量。当前其标注服务已覆盖金融风控、内容审核、自动驾驶、智能客服等数十个场景,为多领域大模型产业化提供可靠的数据基石。