DeepSeek V4 大模型被曝春节前后发布,将具备更强的编程能力
创始人
2026-01-10 14:21:44

【太平洋科技快讯】1 月 10 日消息,据外媒 The Information 昨日报道,DeepSeek 将在未来几周时间内发布新一代旗舰大模型,将具备更强的编程能力。

知情人士透露,这款模型代号 V4,是去年 DeepSeek V3 的迭代版,DeepSeek 内部的初步测试结果显示,V4 在代码生成能力优于 Claude、ChatGPT 等主流大模型。

值得一提的是,去年 12 月发布的 DeepSeek V3.2 模型强化了 Agent 能力并融入思考推理,在某些基准测试中甚至优于 OpenAI GPT-5 和谷歌 Gemini 3.0 Pro。

技术层面,DeepSeek 在去年 12 月 31 日公布了一篇论文,提出了名为 mHC(流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持性能增益,为基础模型的演进提出有希望的方向。

相关内容

热门资讯

当离职员工被“炼化”,谁的数字... 山东一家游戏传媒公司近日将一名离职员工训练成AI数字人,继续承担人事咨询、邀约、制作表格等日常工作。...
苹果Vision Pro头显模... IT之家 4 月 8 日消息,科技媒体 Appleinsider 昨日(4 月 7 日)发布博文,挖...
原创 拉... 雷达财经出品 文|丁禹 编|孟帅 被传“挖”来数名特斯拉的昔日大将,小米汽车的组织架构或再度注入“新...
特普斯微电子申请计算设备最优运... 国家知识产权局信息显示,上海特普斯微电子有限公司申请一项名为“计算设备最优运行参数配置方法、装置、设...
摩根大通CEO:人工智能将带来... AIPress.com.cn报道 摩根大通首席执行官 杰米·戴蒙(Jamie Dimon) 在最新年...