原创 年终盘点爆大瓜,GPT-5被吐槽没进步,Epoch推翻大佬论调真相扎心
创始人
2025-12-26 18:22:15

哈喽,大家好,今天小睿这篇科技深度解析,就来聊聊 GPT-5 遭吐槽 “没进步” 的争议,EpochAI年终报告用硬核数据打脸:AI 不仅在狂飙,通往超级智能(ASI)的脚步还更近了!

2025年末,AI圈陷入一场有趣的争议,GPT-5发布后,不少用户吐槽“没感受到明显进步”,甚至抛出“AI发展停滞”的论调。

就在争议发酵之际,权威研究机构Epoch AI发布年度终期报告,用数百组实测数据和深度洞察给出明确答案:AI不仅没有停滞,反而进入了加速增长的“狂飙期”。

高阶数学测试揭开AI真实水平

Epoch AI在其联合60余名顶尖数学家打造的FrontierMath基准测试中(该测试含350道原创难题,含本科至科研级难度,通过程序化判分确保客观,官方数据源自arXiv论文),对多款开源中文大模型进行了实测。

结果显示,中文开源模型在1-3级基础测试中,最高得分落后全球顶尖模型约7个月。

而在接近科研级的4级测试中,绝大多数中文模型斩获零分,仅DeepSeek-V3.2(Thinking)答对1题,取得2%的得分率。

值得注意的是,即便是GPT、Gemini等全球顶尖模型,在该测试中的表现也不尽如人意,最新纪录保持者Gemini 3 Pro的4级准确率仅为19%。

这一结果印证了一个关键结论,在需要深度理论理解和创造性思维的高阶任务中,当前AI仍处于“小学生摸象”阶段,尚未成为真正的“专家级选手”。

ECI指标揭示增长真相

AI能力加速提升,核心驱动力生变。

为精准追踪AI发展轨迹,Epoch AI构建了Epoch Capabilities Index(ECI)综合指标体系。

数据显示,自2024年4月起,前沿AI模型的能力增长速度较此前提升近一倍,打破了“稳定上升”的传统认知,呈现出“阶段性爆发”的特征。

这一变化的核心驱动力并非传统的“更大模型+更多参数”,而是推理模型的迭代升级与强化学习技术的深度应用。

黄仁勋在后续公开演讲中也佐证了这一趋势,他提到英伟达OpenAI的深度协同正是围绕推理效率提升展开,而当前AI算力需求的叠加效应已远超以往。

这也解释了为何大众会产生“进步不明显”的错觉,AI的进化重心已从“感知层面的功能新增”转向“底层推理能力的质变”,这种提升往往不直接体现在日常交互中,却对产业级应用至关重要。

年终盘点十大热门洞察

AI普惠化加速,研发逻辑重构。

Epoch AI梳理了2025年最受关注的十大行业洞察,其中多项结论颠覆了大众认知。

在成本与普及层面,2023年4月至2025年3月,同等性能下AI推理的token价格下降超10倍,这意味着AI技术正从“大厂专属”转向“全民可用”。

更值得关注的是,前沿AI性能已实现消费级硬件适配,当前顶级开源模型在消费级GPU上的运行效果,与顶尖模型的差距不足一年,未来笔记本电脑运行大模型将成为可能。

在研发层面OpenAI 2024年的大部分算力并未用于训练或服务,而是投入实验探索,印证了当前AI研发仍依赖“试错式创新”。

而英伟达芯片的已部署AI计算量自2020年起每年翻倍,旗舰芯片三年内可占据绝大部分计算量,凸显了GPU作为AI核心燃料的不可替代性。

架构创新与发展边界并存,AI价值争议浮出水面。

行业热点中,DeepSeek的技术突破颇具代表性:其通过多头潜在注意力(MLA)、改进型混合专家(MoE)架构等三项核心技术,以更低算力拿下顶级开源模型席位,后续发布的R1模型性能比肩OpenAI o1,成本却仅为几分之一。

这一案例印证了“架构创新=低成本+快落地”的新研发逻辑,也带动了全球低成本AI研发热潮,斯坦福大学团队甚至以数十美元成本开发出可媲美顶尖模型的推理模型。

但报告也指出了发展边界,OpenAI等机构坦言,强化学习(RL)的扩展速度仅能维持1-2年,将很快触及算力基础设施上限,2024-2025年的爆发式增长可能放缓。

更具争议的是AI价值的实现路径:奥特曼等行业领军者认为“自动化研发是爆发式增长关键”,而Epoch AI则基于1988-2020年历史数据提出,AI的最大价值或将来自经济体系的广泛自动化,而非科研加速,这场分歧本质上关乎AI革命的“节奏与形态”。

相关内容

热门资讯

AI决战春晚!张一鸣拿下202... 12月23日,《晚点LatePost》披露的重磅消息,为2026年春晚注入强烈科技感:字节跳动旗下火...
静安新地标!OPC创新社区火了... 在静安大宁功能区,上海超高清视听产业集聚区“视听静界”已汇聚喜马拉雅、万生华态等一批产业链关键企业。...
【喜报】我市企业荣获省低空装备... 12月26日,第一届山东省低空装备产业链创新创业大赛闭幕式暨低空装备应用场景需求发布活动在日照举办。...
石景山区第一届匠心人才名单公布... 2025年石景山区匠心人才 名单公布 首批共20位 一起来看看吧~ 崔超 崔超,男,1986年5月...
东营杰冠申请具有调节功能的避雷... 国家知识产权局信息显示,东营杰冠建筑工程有限公司申请一项名为“一种具有调节功能的避雷器”的专利,公开...