幻方量化发布DeepSeek-V3模型，生成速度提升3倍，6710亿参数助力AI发展

来源：网络作者：日期：2024-12-27 17:17:48

大模型性价比之王来了！训练2个月、花费558万美元性能匹敌GPT-4o_大模型性价比之王来了！训练2个月、花费558万美元性能匹敌GPT-4o_

其上一代模型DeepSeek-V2.5已于9月6日正式发布，迭代速度还不错。

据介绍，DeepSeek-V3是MoE自主研发的模型。生成速度较V2.5模型提升3倍，但不支持多模态输入输出。（注：MoE模型的全称是Mixture of Experts，它是一种机器学习架构，通过组合多个专家模型，在处理复杂任务时显着提高效率和准确性）。

参数和性能：DeepSeek-V3有6710亿个参数，其中370亿个是激活参数，并在14.8万亿个代币上进行了预训练。

生成速度：与V2.5版本相比，DeepSeek-V3的生成速度提升至3倍，吞吐量高达每秒60个令牌。

开源和可用性：DeepSeek-V3 完全开源。

多语言处理能力：虽然当前版本不支持多模态输入输出，但在多语言处理方面表现良好，尤其是算法代码和数学方面。

答案生成速度更快

此外，在多项基准测试中，DeepSeek-V3均超越了Qwen2.5-72 B、Llama-3.1-405 B等其他开源模型，与全球顶级闭源模型GPT-4o、Claude看齐在性能上。 -3.5-十四行诗并驾齐驱。

其中，在数学能力方面，DeepSeek-V3显着超越所有开源和闭源模型。（小K注：根据2024年美国数学竞赛和全国高中数学联赛题库测试）

值得注意的是，Magic Square Quantization 在开源论文中强调其训练成本极低——通过算法、框架和硬件的优化协同设计，假设 H800GPU 的租赁价格为每块 GPU 2 美元/小时， DeepSeek-V3 的总训练成本仅为 557.6 万美元（注：该成本仅包括 DeepSeek-V3 的正式训练，不包括之前在架构、算法或方面的研究和消融实验相关的成本）数据）：

总培训费用

在预训练阶段，模型仅需要 180K GPU 小时即可训练 1 万亿个 token，即在配备 2048 个 GPU 的集群上仅需 3.7 天。也就是说，现阶段团队使用 2048 个 H800 GPU 训练模型的时间不到 180K GPU 小时。 2个月内实现目标；

此外，加上上下文长度缩放所需的 119K GPU 小时和后训练所需的 5K GPU 小时，DeepSeek-V3 的完整训练仅消耗 2.788M GPU 小时。

来源：开源论文

技术大师Andrej Karpathy赞叹道：作为参考，要达到这种水平的能力，通常需要大约16,000个GPU的计算集群。不仅如此，业界正在部署的集群规模甚至达到了10万个GPU。例如，Llama 3 405B消耗了3080万GPU小时，而看似更强大的DeepSeek-V3仅使用了280万GPU小时（计算量减少了约11倍）。（小K注：Karpathy是OpenAI联合创始人之一，曾担任特斯拉的AI总监）

Stability AI 前首席执行官表示，以每秒 60 个代币（相当于人类阅读速度的 5 倍）的速度全天候运行 DeepSeek-V3 每天的成本仅为 2 美元。

API服务价格上涨了一倍多

DeepSeek-V3的发布标志着DeepSeek AI在自然语言处理和人工智能领域的又一重要进展，有望为开发者、企业和研究人员提供强大的工具和资源。其应用场景主要包括：

聊天和编码场景：专为开发者理解和生成代码而设计，提高编程效率。

多语言自动翻译：支持多达20种语言的实时翻译和语音识别，适合需要处理多种语言内容的企业用户。

图像生成和AI绘画：融合视觉理解技术，让用户通过简单的文字描述生成高质量的图像，丰富应用场景和用户创作表达的自由。

性能更强、速度更快的DeepSeek-V3上线。 Magic Square Quantification给出的定价是多少？新版本型号的价格是上一代的两倍多。

Magic Square 量化表示，DeepSeek-V3 的 API 服务定价将提升至每百万输入代币 0.5 元（缓存命中）/2 元（缓存未命中），每百万输出代币 8 元，按输入价格计算缓存未命中。，总费用为10元。

上一代模型Deepseek-V2.5的价格为：输入：0.14美元/百万Token，输出：0.28美元/百万Token，总成本为0.14+0.28=0.42美元，约3元人民币。

这里的token是一个大模型处理数据时的最小单位。一般来说，100万个代币相当于70万-100万个英文单词，或者接近100万个汉字。列夫·托尔斯泰的代表作《战争与和平》英文版约1200-1500页，58万个英文单词。翻译成中文大约有1-130万字，DeepSeek-V3可以完整阅读。写作仅需2元左右。

尽管价格上涨，但DeepSeek-V3与同类机型相比仍然非常具有性价比。例如，OpenAI的GPT 4o定价相当高。输入：5 美元/百万代币，输出：15 美元/百万代币。总费用为20美元，约合人民币140元。