OpenAI联合美国政府开展人工智能评测项目
创始人
2026-02-27 12:20:57

AIPress.com.cn报道

美国能源部下属的Pacific Northwest National Laboratory(PNNL)与OpenAI宣布合作,围绕美国联邦基础设施审批流程开展人工智能评测项目,重点评估AI在《National Environmental Policy Act》(NEPA)相关文书工作中的辅助能力。该合作基于PNNL的PermitAI™项目展开,后者由美国能源部政策办公室资助,旨在探索通过技术手段提升审批效率。

双方联合19名NEPA领域专家设计了名为DraftNEPABench的基准测试,用于衡量AI模型在真实审批场景下的起草能力。测试覆盖18家联邦机构NEPA文件的不同章节,任务包括阅读并综合数百页技术与监管材料、跨来源核实环境和工程信息,以及按照法律和技术规范撰写结构化报告。

根据公布结果,在代表性任务集中,通用型“编码代理”在合理约束条件下可将单个子章节的起草时间缩短1至5小时,整体草拟时间平均减少约15%。评估采用1至5分制,从结构完整性、表达清晰度、事实准确性和引用规范性等维度进行打分。

此次测试强调“编码代理”模式,即模型通过命令行接口访问文件系统并执行多步骤操作,而非仅依赖简单提示生成文本。这种方式使模型能够系统化读取长文档、进行跨文件核对并生成符合正式结构的报告文本。合作方认为,相比传统静态文档处理方式,相关技术还可生成网页化报告和可视化内容,便于人工审核人员复核。

NEPA实施已超过50年,要求联邦机构对桥梁、电厂、输电线路和制造设施等项目开展环境影响评估。审批流程往往持续数月甚至数年。PNNL与OpenAI表示,该基准测试旨在明确AI在可控范围内能够承担的文书和技术分析工作,而非替代人类决策。

研究同时指出,该基准仅评估在背景材料完备情况下的起草能力,并未涵盖现实审批中的政策裁量和复杂协商过程。如果源材料存在过时或不一致信息,模型未必能主动识别。未来将在专家反馈和迭代机制支持下继续优化相关方案,探索在确保合规与准确性的前提下提升审批效率的可能性。(AI普瑞斯编译)

相关内容

热门资讯

新春服务不打烊  数智赋能过大... (图片来源:摄图网) (记者 陈晓晟)丙午新春,万家团圆。中国电信以坚守诠释忠诚担当,以汗水守护万...
AMD FSR 4.1泄露!上... 快科技2月27日消息,Redstone重大升级之后,AMD正在继续推进FSR技术,下一步将是FSR ...
原创 三... 2026年2月26日凌晨,三星在美国旧金山举办 Galaxy Unpacked 发布会,年度旗舰 G...
原创 O... 当时间指针拨入2026年,全球科技圈的空气中弥漫着一种微妙的焦灼感。 在这个被称为“AI兑现期”的关...
中力股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示中力股份(603194)新获得一项实用新型专利授权,专利名为“...