DeepSeek V4 与腾讯姚顺雨混元模型确定2026年4月同步发布

据白鲸实验室消息,DeepSeek 团队主导的多模态大模型 DeepSeek V4 与腾讯首席 AI 科学家姚顺雨的新一代混元模型将于 2026 年 4 月同步发布。DeepSeek V4 由梁文锋负责研发,重点提升模型的代码理解、长期记忆及多模态处理能力,并计划深度适配国产芯片,成为首个完全依赖国产算力的核心模型。其相关理论研究包括《Conditional Memory via Scalable Lookup》和《mHC: Manifold-Constrained Hyper-Connections》,旨在改进 Transformer 的记忆与稳定性。腾讯方面,姚顺雨自 2025 年起负责公司 AI Infra 与大语言模型部门,其团队研发的新混元模型约含 30 亿参数,聚焦上下文学习与智能体可用性。两款模型的同步发布被视为中国 AI 技术能力与产业化进程的重要节点。

上一篇:

下一篇:

发表回复

登录后才能评论