OpenAI联合美国政府开展人工智能评测项目
创始人
2026-02-27 12:20:57

AIPress.com.cn报道

美国能源部下属的Pacific Northwest National Laboratory(PNNL)与OpenAI宣布合作,围绕美国联邦基础设施审批流程开展人工智能评测项目,重点评估AI在《National Environmental Policy Act》(NEPA)相关文书工作中的辅助能力。该合作基于PNNL的PermitAI™项目展开,后者由美国能源部政策办公室资助,旨在探索通过技术手段提升审批效率。

双方联合19名NEPA领域专家设计了名为DraftNEPABench的基准测试,用于衡量AI模型在真实审批场景下的起草能力。测试覆盖18家联邦机构NEPA文件的不同章节,任务包括阅读并综合数百页技术与监管材料、跨来源核实环境和工程信息,以及按照法律和技术规范撰写结构化报告。

根据公布结果,在代表性任务集中,通用型“编码代理”在合理约束条件下可将单个子章节的起草时间缩短1至5小时,整体草拟时间平均减少约15%。评估采用1至5分制,从结构完整性、表达清晰度、事实准确性和引用规范性等维度进行打分。

此次测试强调“编码代理”模式,即模型通过命令行接口访问文件系统并执行多步骤操作,而非仅依赖简单提示生成文本。这种方式使模型能够系统化读取长文档、进行跨文件核对并生成符合正式结构的报告文本。合作方认为,相比传统静态文档处理方式,相关技术还可生成网页化报告和可视化内容,便于人工审核人员复核。

NEPA实施已超过50年,要求联邦机构对桥梁、电厂、输电线路和制造设施等项目开展环境影响评估。审批流程往往持续数月甚至数年。PNNL与OpenAI表示,该基准测试旨在明确AI在可控范围内能够承担的文书和技术分析工作,而非替代人类决策。

研究同时指出,该基准仅评估在背景材料完备情况下的起草能力,并未涵盖现实审批中的政策裁量和复杂协商过程。如果源材料存在过时或不一致信息,模型未必能主动识别。未来将在专家反馈和迭代机制支持下继续优化相关方案,探索在确保合规与准确性的前提下提升审批效率的可能性。(AI普瑞斯编译)

相关内容

热门资讯

我国首颗能源工程安全监测SAR... 5月15日12时33分,我国首颗能源工程安全监测专用遥感卫星“电建一号”,在东风商业航天创新试验区搭...
“一部手机走天下” 中国式支付... 从一线城市商圈到县域小店,从夜市摊贩到景区门票,在我们的日常生活中,二维码无处不在,移动支付普及率已...
2026上海松江区、青浦区医疗... 根据《2025-2026长三角医疗器械流通合规与产业服务发展报告》数据显示,随着二类医疗器械经营备案...
海外台胞看云南:中华智慧在此焕... 云南大理5月16日电 题:海外台胞看云南:中华智慧在此焕发独特光彩 作者 陆希成 “在云南,中华智慧...
全链条联动!北京全面启动“模数... 为深入落实《工业和信息化部办公厅 国家数据局综合司关于联合实施2026年“模数共振”行动的通知》要求...