与一支由虚拟科学家组成的 AI 团队共事是怎样的体验?
创始人
2025-07-06 21:21:52
0

编辑丨%

4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一生中最超现实的会议之一。在一个名为 Virtual Lab 的系统的在线测试界面中,Montine 构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。

他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。然后,他要求这个虚拟实验室小组研究阿尔茨海默病的可能治疗方法,并讨论知识差距、进展障碍和要测试的假设。

在加利福尼亚州斯坦福大学研究认知障碍的 Montine 正在测试 AI 辅助科学新兴趋势的一个例子:使用聊天机器人专家团队来开发一个科学想法,就像实验室团队可能会做的那样。

探索这一概念的最杰出团队包括科技巨头谷歌的研究人员,当然,去年 11 月,一支斯坦福大学团队宣布了其 Virtual Lab 系统——Montine 正在玩的一个版本。

相关链接:https://www.nature.com/articles/d41586-024-01684-3

去年 10 月,上海人工智能实验室的一个小组也提出了一种类似的虚拟科学家系统,称为 VirSci。

这些虚拟科学家的工作范围涵盖了肝纤维药物开发、癌症小鼠模型优化、阿尔茨海默病探索等场景。在许多这样的系统中,涉及的大型语言模型 (LLM) 不仅仅是相互交流想法。它们还搜索互联网、执行代码并与其他软件工具交互,使它们成为「代理 AI」的一部分。

「代理 AI」指的是 LLM 自主承担任务,即使在此过程中通常仍会有人工的干预。为了探索与虚拟团队合作的感觉,《Nature》杂志邀请了几位科学家试用斯坦福大学的一个版本,并与一些使用过 Google AI 联合科学家的人进行了交谈。

多重人格

所有共事科学家系统都会为代理分配角色或个性,并让它们互动,但具体细节有所不同。

斯坦福大学的计算机科学家 Kyle Swanson 及其团队开发的虚拟实验室配备了两个默认角色:一位首席研究员和一位评论员(提供有益反馈的代理)。用户或 AI 首席可以添加评议员数量,前者还可以选择代理「发言」的轮数。

与斯坦福系统不同,谷歌工具不允许用户为代理分配科学专长。相反,代理具有预定义的具体功能:创意生成;反思或批判;想法的演变;确定想法的接近度以减少重复;排名;以及元评审。

就像所有 LLM 一样,这些代理所驱动的模型有时会胡言乱语,编造出错误的文本。但芝加哥大学的 Rick Stevens 表示,多代理对话中通常会有批评者或评判者来剔除不合理内容。此外,倘若胡言乱语对跳出常规思考有帮助,那它就是有益的。

与 AI 团队共事是什么体验?

斯坦福大学医学研究员 Gary Peltz 经常在工作中使用 AI,他想利用它来寻找治疗肝纤维化的药物。

由于 AI 系统仍在开发中,他将查询发送给了谷歌的一名中间人。他的提示如下:「开发关于肝纤维化过程中肌成纤维细胞生成所需的基因和表观遗传学变化的假设,并指出我们应该测试哪些新药物作为肝纤维化的治疗方法。」并附上了几段背景资料。

图示:Gary Peltz 所收到的 AI 报告。

AI 虚拟科学家提出了三种药物,Peltz 又补充了两种(这些药物均已获批用于治疗其他疾病)。

谷歌赞助了 Peltz 的实验室对这五种药物进行测试。AI 提出的三种建议中有两种显示出促进肝脏再生和抑制纤维化的潜力,而 Peltz 选择的两种药物则没有达到预期效果。

然而,其他肝脏研究人员表示,AI 对药物的建议既不特别创新也不深刻。

纽约市伊坎医学院的肝脏疾病研究员 Shuang Wang 表示,「我个人认为它们很普通,没有什么真知灼见」。

僵硬的对话

斯坦福大学虚拟实验室的代码可以在开发者平台 GitHub 上获取,但该团队为没有计算机科学背景的测试者开发了一个简单的个性化网页界面。Swanson 表示,这个界面与完整系统有些许不同,但使用体验大致相同。

《Nature》邀请的研究人员并没有进行建议的实验,也没有让他们的AI团队编写代码来尝试虚拟实验室。但他们仍觉得 AI 很有帮助。

Montine 举例说,他的 AI 团队出色地综合了当前的知识(其他 LLM 系统也能很好地完成这项任务),并流畅地回答了他的申请资助问题。

另一位测试员是来自巴塞罗那的 Francisco Barriga,他自认为受过生物化学训练,出于兴趣成为一名小鼠模型构建者和基因工程师,完全没有编程技能。在这项实验中,他怀疑自己被当成了非技术背景的对照组。

在这种情况下,Barriga 请 AI 设计小鼠模型实验,AI 提出了他原本就会的方案。但 Barriga 觉得有哪里不对:这些 AI 缺少了一些直觉上的跳跃,就像下午三点你捧着一杯咖啡在走廊上碰到一个科学家时那些灵光乍现的想法。

也许只是需要转换一下思路

《Nature》又找来了一位第三位测试员 Catherine Brownstein,她是一位遗传学家,有更多使用 AI 工具的经验。她认为 LLMs 的用户通常需要是专家,这样才能即时发现错误。

但是当 Brownstein 使用虚拟实验室来批判她正在撰写的论文时,AI 突然询问她患者研究的下一步该往何处发展。Brownstein 对此感到惊讶与感激:她原本没想到这一点,但她本应想到。

这样的心态转变,在曾经也许只是需要工作之余与朋友聊聊,或者是在暖阳下盯着盆栽发个呆,现在却成为了 AI 的提示。她对此表示:「这真是一个谦卑的时刻」。

谷歌宣布其 AI 合作科学家时提到,该系统帮助研究人员提出了「新颖的预测」。正如对 Peltz 经历的反应所显示的,一些科学家质疑这些预测究竟有多新颖。

类似的问题也出现在伦敦帝国理工学院的 José Penadés 团队测试谷歌系统时。他们让 AI 合科学家提出关于细菌进化的详细问题,并要求其提出假设。

AI 给出的假设与现有观点完全相悖,但通过实验,Penadés 的团队却证明该方法可行。

去往未来的道路

目前,旨在帮助科学家撰写实验室报告的多智能体 LLM 系统还没有以更易于使用的形式出现在大众的视野中。但Stevens 预计,许多技术娴熟的研究人员或者大型科技公司将会构建针对不同需求的系统。

与这些多智能体系统互动就像与任何 LLM 聊天一样。但一些测试人员表示,多智能体系统似乎思考得更深入,这可能与某个特定的 LLM 的训练方式有关,也可能多智能体系统本身就更加智能。

然而,Nature 邀请的所有研究人员,以及这些系统的设计师,都表示他们并不认为 AI 能够或应该取代人类:目标不是取代实验室工作人员,而是提供帮助。

他们都认为,将 LLM 引入创意生成和实验设计是不可避免的,就像将互联网搜索引入科学一样。

相关内容

热门资讯

Steam怎么家庭共享给好友?... 你是否曾因为好友没有购买同款游戏而感到遗憾?是否想与亲友分享自己Steam库中的游戏却又不想直接给出...
原创 荣... 现在的智能手机已经开始卷续航了,去年5500mAh也算是大电池,现在6000mAh都要称为小电池了,...
原创 华... 说实话,第一次看到华为Mate XT的时候,我的心情只能用“目瞪口呆”四个字来形容。你说折叠屏手机咱...
小米YU7明日开启首批交付,全... 7月5日,小米汽车官方宣布,小米YU7明天将正式开启全国交付,覆盖全国58个城市。 小米创始人雷军还...
与一支由虚拟科学家组成的 AI... 编辑丨% 4 月的一个星期天早上,病理学家托马斯·蒙廷 (Thomas Montine) 召开了他一...
新城区开展教师人工智能深度应用... 7月4日下午,由新城区总工会、新城区教育局共同主办的2025年全区教师人工智能和DeepSeek深度...
上海天文馆密集上新,暑期每周六... 昨晚,上海天文馆(上海科技馆分馆)“奇幻星舞台”发布科学桌游《烹饪宇宙》和一站式天文入门教育工具包《...
提升中国病理诊断水平,瑞金医院... (文/观察者网 吕栋) “以往医生看病理切片,就像在森林中找一片异常的树叶。中国的病理医生每天要在...
“国球进商圈”点燃周末 智能乒... 7月5日晚,2025年上海城市业余联赛上海市智能乒乓球比赛——嘉定菊园新区国球进商圈活动活力开启,巧...
桃子为什么甜?我国科研人员找到... 炎炎夏日,饱满香甜的桃子是广受欢迎的当季水果之一。但你知道桃子为什么甜吗?中国科学院武汉植物园的一项...
长江存储首席科学家:我国三维闪... 近日,在2025年北大研究生毕业典礼上,长江存储首席科学家、校友霍宗亮寄语毕业生:北大与民族复兴紧密...
“剧透”未来!从低空到太空,看... 在合肥骆岗公园这个由老机场改造而成的城市公园中,一场与众不同的“无人机”飞行秀正在上演。 半径不超过...
台风“丹娜丝”或走出“Z字型”... 今天(7月6日)早晨,台风“丹娜丝”已加强为台风级,预计今夜至明晨它将穿过台湾海峡,存在登陆台湾沿海...
闻“汛”而动!甘肃移动通信铁军... 7月3日深夜,甘肃移动网络监控大厅显示,陇南武都区琵琶、碧口、洛塘3镇汇聚网络实现通达,现场人员长舒...
省通信管理局、省住建厅围绕四大... 本报太原7月5日讯(记者王蕾)为进一步推动5G网络和千兆光网深度覆盖,近日,省通信管理局、省住建厅联...
隆苹科技申请一种悬挂式多功能音... 金融界2025年7月5日消息,国家知识产权局信息显示,深圳隆苹科技有限公司申请一项名为“一种悬挂式多...
火星改造可行性研究引发热议 2025-07-05 09:40:47 作者:狼叫兽 近日,一篇发表在自然天文学杂志上的研究论文再...
科学家开发无氢氟酸MXene制... 7 月 6 日消息,维也纳工业大学(TU Wien)的科学家团队与 CEST 和 AC2T 合作,开...
焦点访谈|厘清“刷脸”边界 筑... 央视网消息 (焦点访谈):人脸信息与人体的其他生物特征,如指纹、虹膜等与生俱来,具有唯一性。这些关键...
无人驾驶特斯拉首次交付,突破还... 6月28日,特斯拉宣布了在自动驾驶运营领域的新进展。视频显示,一台Model Y从位于美国得克萨斯州...