DeepSeek发布新模型，不是R2，而是Prover

就在刚刚，Deepseek在huggingface发了新模型，既不是R2，也不是V4！

而是倒退版本、从来没有听过的DeepSeek-Prover-V2-671B模型，新的专家模型！

DeepSeek-Prover-V2-671B是基于DeepSeek-V3架构的一个专门用于数学证明的大型语言模型，具有以下特点：

config.json：

这是模型的核心配置文件，定义了DeepSeek-V3/Prover-V2的架构参数

configuration_deepseek.py：

这是模型配置类的Python实现，定义了DeepseekV3Config类

DeepSeek-Prover-V2-671B应该是DeepSeek最新发布的针对数学证明领域的顶级模型，相比通用语言模型，它在数学推理、形式证明、定理验证等方面应该有更强的能力。

这种专业化大模型代表了当前AI研究的一个重要方向：为特定领域开发超大规模的专家模型。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2025-04-30，如有侵权请联系 cloudcommunity@tencent 删除DeepSeek量化模型配置数学

科技改变生活-雨落星辰 - 所有的伟大,都源于一个勇敢的开始