ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
创始人
2025-07-02 23:02:01
0

新智元报道

编辑:定慧

【新智元导读】 MIT最新研究让LLM直接操控宇宙飞船进行太空追逐挑战赛:ChatGPT少量微调即获第二,开源Llama更胜一筹,凭提示词精准追踪卫星、节省燃料,更是0%失败率,验证AI小数据高效与自主航天可行,为未来的太空漫游铺路。

刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了!

在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。

这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!

或许,太空漫游2027真的可以成为现实!围绕地球的卫星、太空垃圾未来都可能由AI自主运行和处理。

研究团队并没有重度训练模型,而是巧妙地用提示词工程+少量微调,就让ChatGPT成功驾驭复杂的太空任务:追击卫星、规避侦测……样样精通。

整个系统由文本状态输入→语言模型决策→代码执行三步组成,展现出LLM模型强大的泛化与适应能力。

MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。

论文地址:https://arxiv.org/pdf/2505.19896

研究亮点速览:

  • ChatGPT用文字指令完成飞船导航、控制决策,表现远超预期;

  • 研究无需大规模训练,充分利用LLM已有知识与语言理解;

  • 虽仍有「幻觉」等风险,但自主化航天已从幻想变为可行路线。

AI自主开飞船上太空

研究人员长期以来一直致力于开发用于卫星控制和航天器导航的自主系统。

未来的卫星数量实在太多,人类无法全部手动进行控制。

而对于深空探测来说,光速的限制意味着我们无法实时直接控制航天器。

如果我们真的想要在太空领域拓展,就必须让机器人自己做决定。

为了鼓励创新,近年来航空研究人员创建了《Kerbal Space Program》博弈挑战赛。

这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个(某种程度上)真实的环境中设计、试验和测试自主系统。

《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad开发的一款太空飞行模拟视频游戏,于2015年发布。

尽管它是一款游戏,但通过添加模组(mod),它可以被用作模拟环境,这些模组可以增加诸如更真实的物理效果等新功能。

尽管KSP并未提供对现实的完美模拟,但其精确的轨道力学机制受到了赞誉,甚至与NASA建立了合作关系,使其地位超越了一款普通游戏。

该模拟环境被限制为一个二体问题,并且仅限于少量行星,最常见的情况是只有一个名为Kerbin的类地行星。

该挑战赛包含多个场景,例如追踪并拦截卫星的任务以及规避探测的任务。

研究人员决定使用LLM,因为传统的控制方法需要经过多轮的训练、反馈和改进。

但Kerbal挑战的本质是尽可能逼真,这意味着任务仅持续数小时。

因此,不断改进模型将变得不切实际。

LLM之所以如此强大,是因为它们已经接受了大量人类写作文本的训练。

因此在最佳情况下,它们只需要少量精心设计的提示工程和几次尝试,就能为特定情境获取正确的上下文。

但这样一个「对话」模型真的可以驾驶宇宙飞船吗?

用GPT和Llama开飞船

首先介绍一下KSP挑战中需要解决的问题,智能体通过推力发动机控制航天器在所有三个旋转轴(偏航、俯仰和滚动)上的运动。

动作是在航天器的参考系下表达的,包括每个轴的推力大小以及施加推力的持续时间。

KSP挑战包含以下三种场景:

  • 追击者-逃逸者:智能体控制追击者。主要目标是使追击者与逃逸者之间的距离最小化。

  • 目标守卫:智能体控制劫匪航天器靠近航天器。

  • 遮挡太阳:智能体旨在将航天器定位在逃逸者与太阳之间。

    本研究的讨论范围只有「追击者-逃逸者」范畴。

在追击者-逃逸游戏的不同场景中,逃逸者的初始轨道在所有场景中保持不变,而追击者的初始轨道则有所变化。

追击者和逃逸者具有相同的飞行器参数。

评估指标包括追击者与逃逸者之间的距离(米)、最近接近时的速度(米/秒)、追击者燃料消耗量(千克)以及经过的时间(秒)。

明确了任务,让我们具体看看GPT和Llama是怎么开飞船的,该研究探索了两种路线:

1. ChatGPT+微调

选用GPT是因其易于使用,重点使用微调模型策略。

2. Llama+提示词工程

选用Llama则是由于其社区支持和开源灵活性,使用提示工程进行主要研究路线,并进行简单微调。

研究人员开发了一种方法,用于将航天器的给定状态及其目标以文本形式进行翻译。

然后,他们将其传递给LLM,并要求LLM提供如何调整和操控航天器的建议

研究人员随后开发了一个翻译层,将LLM基于文本的输出转换为可操作模拟飞行器的功能代码。

研究通过生成多个轨道的示例,用于收集Llama训练数据。

研究还给出了轨道数据生成的伪代码。

通过一系列简短的提示和一些微调,研究人员让ChatGPT完成了挑战中的许多测试任务,并且它在最近的一场竞赛中最终获得了第二名。

Llama竟然打败了GPT

有趣的是,OpenAI的微调API需要定制,但它提供的工具非常有限,尤其是与Llama相比。

因此,GPT训练的效果在很大程度上取决于数据的数量和质量,以及某些调整(特别是超参数),其中LRM的影响最为显著。

思维链方法的应用显著提高了飞船驾驶技术在追击问题中的泛化能力,并成功引导模型实现了执行过程中的0%失败率

Llama的结果远超研究人员预期。

该模型不仅遵循了一条稳定的顺行轨道,而且在KSPDG挑战中表现优于几乎所有其他方法。

需要强调的是,基础的Llama模型比GPT模型取得了更好的结果。

然而,考虑到Llama-3是与GPT-4竞争的模型,而非研究中GPT方法中使用的GPT-3.5,这一结果是在预期之内的。

(果然即使是研究人员也烧不起API的钱,开源这一点确实促进了生态的发展)

研究团队表示,这次研究发现结果非常令人满意。

轨道生成和智能体集成表明,使用AI构建训练场景可以作为一个出色且简单的模拟引擎替代方案。

虽然这个研究还属于早期,并且使用模型也不是目前最新的顶尖AI模型,但这个研究探索本身就很有启发意义。

未来我们不仅要竞争地面资源,太空资源也成为了新时代的「兵家必争之地」。

马斯克的星链计划已经开始抢占地球的低空轨道资源。

根据目前的数据统计,截止2025年上半年,在轨的星链卫星已经突破了6500+。

这是一个非常庞大的数量,虽然现在星链的运行只是按照既定轨道,少量需要人类干预,未来呢?

单纯靠人来控制这些卫星完全不够,也不现实。

所以这个研究如果真的能够让LLM来控制太空飞行器,那么将颠覆未来的太空竞赛生态。

在美剧《太空部队》中编剧设想了一个场景:

中国的空间站飞行到美国卫星上方时,运用机械臂将美国卫星的翅膀给剪了下来。

然后,美国的卫星就变成了太空垃圾。

除了编剧的「恶趣味」以外,AI上太空开飞船的场景还有很多,比如《特种部队2:全面反击》中太空钨棒武器。

或者是《火星救援》中的远航小队,如果有了足够智能的AI,就不用冒险再返回拯救马特达蒙,人类派出AI就够了。

这些场景未来还有很多很多。

甚至,最近硅谷投资彼得·蒂尔透露马斯克说要放弃殖民火星的梦想。还在采访中说「2024年是埃隆不再相信火星的一年。」

马斯克的转变是受到他与谷歌DeepMind CEO Demis Hassabis的一次谈话影响。

两人讨论了人工智能和星际旅行哪个会成为世界上最重要的技术进步。

据报道说,在Hassabis告诉他「你知道我的人工智能将能够跟随你去火星」后,Elon沉默了。

不管老马因为什么原因对火星失去信心,但是如果AI真的能够自主驾驶宇宙飞船,也许可以帮助他继续殖民火星的梦想!

可以设想一下,未来进行这种太空攻防对抗、互助救援和殖民外星球的背后,不仅仅比拼人的水平,还有AI的能力——谁家的AI更聪明、更智能。

毕竟,在太空探索的背景下,人类的一生还是太过于短暂,也许只有AI能扛过时间的侵蚀了。

人类终将沉睡于时光的尘埃,而AI,或许是那唯一能在深空中继续诉说文明故事的见证者。

——ChatGPT

参考资料:

https://arxiv.org/abs/2505.19896

相关内容

热门资讯

鄂尔多斯:“车路云一体化”让“... 无人驾驶公交车在城市中轴线上丝滑行驶,自动驾驶清扫车在街道上穿梭工作,无人售货车在广场上招手即停……...
原创 成... 继纵横股份、中无人机、立航科技成功上市之后,又一家成都无人机企业向A股市场发起冲刺。7月2日证监会网...
荣成歌尔科技取得半自动装配装置... 金融界2025年7月2日消息,国家知识产权局信息显示,荣成歌尔科技有限公司取得一项名为“一种半自动装...
恒泰众邦取得爬楼搬运车专利,扩... 金融界2025年7月2日消息,国家知识产权局信息显示,山东恒泰众邦智能科技有限公司取得一项名为“一种...
原创 打... 提起小米,很多人第一反应不是手机,而是“全能制造商”。从39块的电蚊拍,到几十万的小米SU7、小米Y...
登顶全球第一!北航郑耀威! 他以学生一作 发表高水平学术论文6篇 谷歌学术引用量超过600次 第一作者论文引用量超过500次 他...
小米YU7爆单,造车新势力们打... 出品|新品略财经 吴文武 小米YU7爆单,造车新势力们打响“截米”大战,背后更值得关注。 小米YU...
原创 火... 凌晨三点钟的休斯顿火箭队总部灯火通明,总经理斯通叼着半块冷掉的披萨,手指在办公桌上敲出急促的节奏。当...
智谱AI旗下上海智谱寰宇科技公... 天眼查App显示,近日,上海智谱寰宇科技有限公司发生工商变更,注册资本由1000万人民币增至5亿人民...
放弃百万年薪,“95后”清华博... 据“清华大学”微信公众号7月3日消息,清华大学交叉信息研究院2025届博士毕业生汶川将以助理教授的身...
微软偷偷安装KB5001716... 快科技7月3日消息,微软在Windows 10和Windows 11系统中偷偷推送并安装了名为KB5...
“算力+场景”双驱动 郑州将发... 顶端新闻·河南商报首席记者 孙科 发力当前竞争最激烈的赛道,郑州出台专项政策。 日前,《郑州市场景驱...
微软 AI 诊断准确率超人类医... 四倍,AI 医生的诊断准确率远超过人类医生。 这可能有点难以置信,但微软人工智能团队日前发布的一项 ...
白玉县农研科普中心打造农业智能... 在数字化浪潮席卷全球的当下,农业领域也正经历着一场深刻变革。四川省甘孜州白玉县依托当地农研科普中心,...
机场「拦下」充电宝 「核心提示」 低价厮杀埋雷,召回风波下充电宝行业格局迎来大洗牌。 作者 | 詹方歌 编辑 |...
力帆铝业取得新型四合一密封隐拉... 金融界2025年7月2日消息,国家知识产权局信息显示,佛山市南海力帆铝业有限公司取得一项名为“一种新...
原创 黑... 在今天,中国品牌已经将机械键盘价格打到百元以下,称中国消费者实现机械键盘自由并不夸张。在这一基础上,...
爱尚思取得电子元器件加工模具专... 金融界2025年7月3日消息,国家知识产权局信息显示,深圳市爱尚思科技有限公司取得一项名为“一种电子...
2025年能源与人工智能报告 今天分享的是:2025年能源与人工智能报告 报告共计:304页 《2025年能源与人工智能报告》围绕...