APP下载
APP二维码
联系我们
APP二维码
返回

幻方量化发布DeepSeek-V3模型,生成速度提升3倍,6710亿参数助力AI发展

来源:网络   作者:   日期:2024-12-27 17:17:48  

image

大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o_大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o_

其上一代模型DeepSeek-V2.5已于9月6日正式发布,迭代速度还不错。

据介绍,DeepSeek-V3是MoE自主研发的模型。生成速度较V2.5模型提升3倍,但不支持多模态输入输出。 (注:MoE模型的全称是Mixture of Experts,它是一种机器学习架构,通过组合多个专家模型,在处理复杂任务时显着提高效率和准确性)。

参数和性能:DeepSeek-V3有6710亿个参数,其中370亿个是激活参数,并在14.8万亿个代币上进行了预训练。

生成速度:与V2.5版本相比,DeepSeek-V3的生成速度提升至3倍,吞吐量高达每秒60个令牌。

开源和可用性:DeepSeek-V3 完全开源。

多语言处理能力:虽然当前版本不支持多模态输入输出,但在多语言处理方面表现良好,尤其是算法代码和数学方面。

image

答案生成速度更快

此外,在多项基准测试中,DeepSeek-V3均超越了Qwen2.5-72 B、Llama-3.1-405 B等其他开源模型,与全球顶级闭源模型GPT-4o、Claude看齐在性能上。 -3.5-十四行诗并驾齐驱。

image

其中,在数学能力方面,DeepSeek-V3显着超越所有开源和闭源模型。 (小K注:根据2024年美国数学竞赛和全国高中数学联赛题库测试)

image

值得注意的是,Magic Square Quantization 在开源论文中强调其训练成本极低——通过算法、框架和硬件的优化协同设计,假设 H800GPU 的租赁价格为每块 GPU 2 美元/小时, DeepSeek-V3 的总训练成本仅为 557.6 万美元(注:该成本仅包括 DeepSeek-V3 的正式训练,不包括之前在架构、算法或方面的研究和消融实验相关的成本) 数据):

image

总培训费用

在预训练阶段,模型仅需要 180K GPU 小时即可训练 1 万亿个 token,即在配备 2048 个 GPU 的集群上仅需 3.7 天。也就是说,现阶段团队使用 2048 个 H800 GPU 训练模型的时间不到 180K GPU 小时。 2个月内实现目标;

此外,加上上下文长度缩放所需的 119K GPU 小时和后训练所需的 5K GPU 小时,DeepSeek-V3 的完整训练仅消耗 2.788M GPU 小时。

image

image

来源:开源论文

技术大师Andrej Karpathy赞叹道:作为参考,要达到这种水平的能力,通常需要大约16,000个GPU的计算集群。不仅如此,业界正在部署的集群规模甚至达到了10万个GPU。例如,Llama 3 405B消耗了3080万GPU小时,而看似更强大的DeepSeek-V3仅使用了280万GPU小时(计算量减少了约11倍)。 (小K注:Karpathy是OpenAI联合创始人之一,曾担任特斯拉的AI总监)

image

Stability AI 前首席执行官表示,以每秒 60 个代币(相当于人类阅读速度的 5 倍)的速度全天候运行 DeepSeek-V3 每天的成本仅为 2 美元。

API服务价格上涨了一倍多

DeepSeek-V3的发布标志着DeepSeek AI在自然语言处理和人工智能领域的又一重要进展,有望为开发者、企业和研究人员提供强大的工具和资源。其应用场景主要包括:

聊天和编码场景:专为开发者理解和生成代码而设计,提高编程效率。

多语言自动翻译:支持多达20种语言的实时翻译和语音识别,适合需要处理多种语言内容的企业用户。

图像生成和AI绘画:融合视觉理解技术,让用户通过简单的文字描述生成高质量的图像,丰富应用场景和用户创作表达的自由。

性能更强、速度更快的DeepSeek-V3上线。 Magic Square Quantification给出的定价是多少?新版本型号的价格是上一代的两倍多。

Magic Square 量化表示,DeepSeek-V3 的 API 服务定价将提升至每百万输入代币 0.5 元(缓存命中)/2 元(缓存未命中),每百万输出代币 8 元,按输入价格计算缓存未命中。 ,总费用为10元。

上一代模型Deepseek-V2.5的价格为:输入:0.14美元/百万Token,输出:0.28美元/百万Token,总成本为0.14+0.28=0.42美元,约3元人民币。

这里的token是一个大模型处理数据时的最小单位。一般来说,100万个代币相当于70万-100万个英文单词,或者接近100万个汉字。列夫·托尔斯泰的代表作《战争与和平》英文版约1200-1500页,58万个英文单词。翻译成中文大约有1-130万字,DeepSeek-V3可以完整阅读。写作仅需2元左右。

尽管价格上涨,但DeepSeek-V3与同类机型相比仍然非常具有性价比。例如,OpenAI的GPT 4o定价相当高。输入:5 美元/百万代币,输出:15 美元/百万代币。总费用为20美元,约合人民币140元。

image

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。