阿里Qwen3.7-Max模型AI编程能力超Claude Opus 4.6
创始人
2026-05-26 18:55:08

IT之家 5 月 26 日消息,全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二。

IT之家查询公开资料,Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型(LLM)能力评估榜单之一。

该榜单不测试学术化的选择题,而是评估模型在生成、调试、重构复杂代码时的实际编程能力,此外为防止刷榜(Anti-Gaming),采用用户随机盲测,模型无法提前获知考题,让模型必须具有真实的硬核代码生成能力。

根据最新榜单成绩,阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分,在全球模型榜单中排名第四,仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。

阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型,并超过了 glm-5.1、kimi-k2.6 模型。

IT之家查询公开资料,在最新放出的 Design Arena 榜单中,阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩,位列第十名。

Design Arena (以及其图像侧 Image Arena / LMArena) 作为一个基于真实用户盲测的 AI 模型评测平台,在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一,被称为“AI 界的奥林匹克”。

相关内容

热门资讯

小米MiMo Token Pl... IT之家 6 月 2 日消息,小米今日正式公布了 MiMo Token Plan 老用户专属“回归礼...
2026年6月防销售飞单AI工... 销售飞单、私单、客资外流,是各大销售型企业长期面临的核心难题。普通通讯设备缺乏管控能力,改装机型存在...
苹果智能眼镜据报道推迟至202... 如果你一直期待着拥有一副苹果智能眼镜,恐怕需要比预期等待更长的时间了。 据彭博社记者马克·古尔曼透露...
Anthropic刚递表IPO... Anthropic已经秘密向美国证券交易委员会(SEC)递交了 S-1注册声明草稿。这意味着一旦SE...
智博会启新章 中国电信深耕AI... (记者 林碧涓)2026世界智能产业博览会于5月28日至31日在天津举办。本届博览会由天津重庆两地政...