这一围棋AI,有何不同?
创始人
2025-06-03 14:41:36
0

近日,在上海市宝山区智慧湾科创园里,上演了一场人与AI大模型的围棋“智斗”。

这个大模型名为书生·思客(InternThinker),由上海人工智能实验室开发,它在围棋任务上具备较强的专业水平,还能运用自然语言就对弈过程进行“解说”。

现场排队等待与书生·思客对弈的小朋友很多,原计划下午5点结束的活动延迟半小时收摊,成为整个展厅最晚“撤退”的展台之一。

拍摄:陈蒋逸

自2016年AlphaGo四比一战胜李世石,随后又三比零战胜当时世界排名第一的柯洁后,各类围棋AI竞相涌现,如国内较为知名的绝艺、星阵、Katago等。书生·思客有何不同之处?

工作人员介绍, 相较于直接用围棋棋盘状态训练人工智能的路径,书生·思客要将搜索过程的状态建模转化为语言建模让机器学习,而语言建模的训练计算量大大增加

训练大模型围棋能力的挑战不止于此。上海人工智能实验室青年研究员李林阳表示:“飞、虎、粘、长等围棋术语是从棋盘画面出发去理解的,而大模型学习下棋时只能根据坐标而非画面来学习,其难度堪比‘盲棋’,即不看棋盘来模拟下棋。”

围棋这项古老的运动也被称为“手谈”,即棋手通过棋盘的落子表达自己对棋局的看法,仿佛用手在棋局中“交谈”。“盲棋”则是对局者之间没有棋盘,完全依靠报出棋盘上的坐标来落子,挑战更大。

据悉,为保证训练效果,上海人工智能实验室研究团队构建了一个“加速训练营”(InternBootcamp),通过对评价建模,与大模型进行交互并提供反馈,从而使大模型持续进化,获得解决复杂推理任务的能力。通过该方法,书生·思客已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多个专业任务同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”(在单一任务中,无法成功推理得到奖励的模型,通过多个任务混合的强化学习,能够在训练过程中成功得到奖励,实现领域外专业任务的有效强化学习训练)。

在实操中,书生·思客在与展台的儿童对弈时,均占上风。

拍摄:陈蒋逸

李林阳表示,团队最主要的目标并不在于棋力的提升,而是为了锻炼大模型的推理能力、逻辑思维,如此后续可以期待大模型完成更多专业的任务。

“我们将这样专业的能力融合在通用模型里,它就会有更泛化的通用能力。”李林阳说。

这种“通专融合”技术路线由上海人工智能实验室率先提出并不断探索。从大模型发展历程看,主要分化为专业性和通用泛化性两大路线。实验室致力于解决大模型高度专业化和通用泛化性相互制约的发展困境,期待模型不仅在广泛的复杂任务上表现出色,还能在特定领域中达到专业水平。

工作人员告诉记者,在通用大模型的专业任务探索上,起码针对围棋这一任务,书生·思客大模型已经超越不少国内外主流大模型,是首个既具备围棋专业水平,又能展示透明思维链的大模型。

作者:霍星羽 陈蒋逸(实习生)

相关内容

热门资讯

省内首家机器人学院宣布成立 省内首家机器人学院宣布成立 计划2027年正式招生 湖北日报讯 (记者李玉麟、通讯员龙华、李美琳)...
浙江三花商用制冷申请一种电磁阀... 金融界2025年6月4日消息,国家知识产权局信息显示,浙江三花商用制冷有限公司申请一项名为“一种电磁...
意法半导体与高通合作成果落地:... IT之家 6 月 5 日消息,意法半导体今日宣布,Wi-Fi 6 和低功耗蓝牙 5.4 二合一模块 ...
经济日报刊文:发挥机器人投顾服... 一直以来,“人工智能+”为金融服务带来了很多变化。不久前陆续披露的上市银行2024年年报数据显示,多...
汽车驾驶辅助系统安全要求拟定国... 快科技6月4日消息,据报道,全国标准信息公共服务平台公示关于征求《智能网联汽车 组合驾驶辅助系统安全...
瑞能创新取得探针安装结构专利,... 金融界2025年6月4日消息,国家知识产权局信息显示,深圳市瑞能创新科技有限公司取得一项名为“探针安...
新鸿泰见证:天力商写发布碳中和... 4 月 22 日世界地球日,碧桂园服务天力商写在广州邦华环球广场举办“向绿而行・碳惠新生” 主题活动...
原创 v... 开头先来一波灵魂拷问:当你举着半斤重的折叠屏当哑铃健身时,隔壁同事突然掏出一台比iPhone还轻的大...
Hugging Face称其开... IT之家 6 月 5 日消息,本周早些时候,人工智能开发平台 Hugging Face 发布了一款名...
学生用AI写作业怎样识别?专家... 你怎么知道这是AI写的 如果要问DeepSeek、ChatGPT、文心一言、豆包、Kimi等生成式大...
原创 1... 不久前,美图发布公告,官宣获得阿里巴巴2.5亿美元(约合人民币18亿元)的战略投资。 相较于财务方面...
多普勒流量仪的优势详解 【型号推荐:RS-DOPL,工业级品质,精准可靠】 在工业生产、环境监测以及水资源管理等领域,流体流...
我国第三代自主超导量子计算机,... 6月4日,记者从安徽省量子计算工程研究中心获悉,我国第三代自主超导量子计算机“本源悟空”自2024年...
一个有趣的问题:中文BBS的遗... 那么问题来了——BBS的上述特点被谁继承了呢?放眼2022年的中文互联网,好像没有什么特别完美的继承...
大疆扫地机器人要来了,慌的不止... 作者 | 源媒汇 谢春生 云鲸智能(下称“云鲸”)最害怕的竞争对手要来了。 近日,据综合报道,大疆...
AI眼镜专题:AI眼镜「预选赛... 今天分享的是:AI眼镜专题:AI眼镜「预选赛」格局报告 报告共计:34页 《AI眼镜专题:AI眼镜「...
华为已开启Pura 80盲约:... 【CNMO科技消息】6月5日,CNMO从华为官方商城了解到,华为已经开启了华为Pura 80系列的盲...
黄金手办,能否持续“收割”年轻... 文 | 道总有理 五月份,老凤祥与《圣斗士星矢》推出联名产品,上市短短两周,系列产品已创下近亿元销...
数智供应链行动计划发布 构建协... (记者 陈锦锋)在数字经济与实体经济深度融合的浪潮中,供应链正经历从“链式反应”到“网状生态”的范式...
曝谷歌Pixel 10系列手机... 前段时间,有消息称谷歌将于2025年8月20日举办“Made by Google”发布会。届时,Pi...