DeepSeek V4 大模型被曝春节前后发布,将具备更强的编程能力
创始人
2026-01-10 14:21:44

【太平洋科技快讯】1 月 10 日消息,据外媒 The Information 昨日报道,DeepSeek 将在未来几周时间内发布新一代旗舰大模型,将具备更强的编程能力。

知情人士透露,这款模型代号 V4,是去年 DeepSeek V3 的迭代版,DeepSeek 内部的初步测试结果显示,V4 在代码生成能力优于 Claude、ChatGPT 等主流大模型。

值得一提的是,去年 12 月发布的 DeepSeek V3.2 模型强化了 Agent 能力并融入思考推理,在某些基准测试中甚至优于 OpenAI GPT-5 和谷歌 Gemini 3.0 Pro。

技术层面,DeepSeek 在去年 12 月 31 日公布了一篇论文,提出了名为 mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持性能增益,为基础模型的演进提出有希望的方向。

相关内容

热门资讯

智元:未来五年投入20亿元,用... 新京报贝壳财经讯(记者张晓慧)6月9日,具身智能企业智元(AGIBOT)发布致全体开发者伙伴的公开信...
618福利满满!三星Galax... 在智能手机存量竞争的当下,折叠屏品类逆势实现稳步增长。IDC数据显示,2025年中国折叠屏手机出货量...
小红书正式上线RED Skil... 6月8日,砍柴网媒体获悉,小红书近日正式上线了RED Skill功能。 目前,在部分创作者的小红书笔...
苹果iOS 27测试版升级教程... 快科技6月9日消息,今天凌晨,苹果正式发布推送iOS 27首个开发者测试版,全新Siri AI、Li...
工业和信息化部信息通信管理局指... 随着“618”各类电子商务促销活动不断增多,部分APP在开屏和弹出的信息窗口中,采用违规方式诱导用户...