AIPress.com.cn报道
美国能源部下属的Pacific Northwest National Laboratory(PNNL)与OpenAI宣布合作,围绕美国联邦基础设施审批流程开展人工智能评测项目,重点评估AI在《National Environmental Policy Act》(NEPA)相关文书工作中的辅助能力。该合作基于PNNL的PermitAI™项目展开,后者由美国能源部政策办公室资助,旨在探索通过技术手段提升审批效率。
双方联合19名NEPA领域专家设计了名为DraftNEPABench的基准测试,用于衡量AI模型在真实审批场景下的起草能力。测试覆盖18家联邦机构NEPA文件的不同章节,任务包括阅读并综合数百页技术与监管材料、跨来源核实环境和工程信息,以及按照法律和技术规范撰写结构化报告。
根据公布结果,在代表性任务集中,通用型“编码代理”在合理约束条件下可将单个子章节的起草时间缩短1至5小时,整体草拟时间平均减少约15%。评估采用1至5分制,从结构完整性、表达清晰度、事实准确性和引用规范性等维度进行打分。
此次测试强调“编码代理”模式,即模型通过命令行接口访问文件系统并执行多步骤操作,而非仅依赖简单提示生成文本。这种方式使模型能够系统化读取长文档、进行跨文件核对并生成符合正式结构的报告文本。合作方认为,相比传统静态文档处理方式,相关技术还可生成网页化报告和可视化内容,便于人工审核人员复核。
NEPA实施已超过50年,要求联邦机构对桥梁、电厂、输电线路和制造设施等项目开展环境影响评估。审批流程往往持续数月甚至数年。PNNL与OpenAI表示,该基准测试旨在明确AI在可控范围内能够承担的文书和技术分析工作,而非替代人类决策。
研究同时指出,该基准仅评估在背景材料完备情况下的起草能力,并未涵盖现实审批中的政策裁量和复杂协商过程。如果源材料存在过时或不一致信息,模型未必能主动识别。未来将在专家反馈和迭代机制支持下继续优化相关方案,探索在确保合规与准确性的前提下提升审批效率的可能性。(AI普瑞斯编译)