OpenAI联合美国政府开展人工智能评测项目_科技资讯

OpenAI联合美国政府开展人工智能评测项目

创始人

2026-02-27 12:20:57

AIPress.com.cn报道

美国能源部下属的Pacific Northwest National Laboratory（PNNL）与OpenAI宣布合作，围绕美国联邦基础设施审批流程开展人工智能评测项目，重点评估AI在《National Environmental Policy Act》（NEPA）相关文书工作中的辅助能力。该合作基于PNNL的PermitAI™项目展开，后者由美国能源部政策办公室资助，旨在探索通过技术手段提升审批效率。

双方联合19名NEPA领域专家设计了名为DraftNEPABench的基准测试，用于衡量AI模型在真实审批场景下的起草能力。测试覆盖18家联邦机构NEPA文件的不同章节，任务包括阅读并综合数百页技术与监管材料、跨来源核实环境和工程信息，以及按照法律和技术规范撰写结构化报告。

根据公布结果，在代表性任务集中，通用型“编码代理”在合理约束条件下可将单个子章节的起草时间缩短1至5小时，整体草拟时间平均减少约15%。评估采用1至5分制，从结构完整性、表达清晰度、事实准确性和引用规范性等维度进行打分。

此次测试强调“编码代理”模式，即模型通过命令行接口访问文件系统并执行多步骤操作，而非仅依赖简单提示生成文本。这种方式使模型能够系统化读取长文档、进行跨文件核对并生成符合正式结构的报告文本。合作方认为，相比传统静态文档处理方式，相关技术还可生成网页化报告和可视化内容，便于人工审核人员复核。

NEPA实施已超过50年，要求联邦机构对桥梁、电厂、输电线路和制造设施等项目开展环境影响评估。审批流程往往持续数月甚至数年。PNNL与OpenAI表示，该基准测试旨在明确AI在可控范围内能够承担的文书和技术分析工作，而非替代人类决策。

研究同时指出，该基准仅评估在背景材料完备情况下的起草能力，并未涵盖现实审批中的政策裁量和复杂协商过程。如果源材料存在过时或不一致信息，模型未必能主动识别。未来将在专家反馈和迭代机制支持下继续优化相关方案，探索在确保合规与准确性的前提下提升审批效率的可能性。（AI普瑞斯编译）

上一篇：2000多买一台太阳能多功能农业机器人，实现人在家中坐，活在地里干

下一篇：魅族官宣战略转型：暂停国内手机新产品自研硬件项目，专注Flyme软件生态赋能

OpenAI联合美国政府开展人工智能评测项目

相关内容

热门资讯