APP下载
APP二维码
联系我们
APP二维码
返回

DeepSeek-V3-0324模型更新发布:6850亿参数、MIT开源协议及编程能力大幅提升

来源:网络   作者:   日期:2025-03-25 12:12:03  

K图 BK1188_0

3月24日晚上,DeepSeek推出了更新的DeepSeek-V3型号的小版本。新型号的版本编号为DeepSeek-V3-0324,模型参数为6850亿,与第一个V3版本的6710亿版本略有增加。 DeepSeek尚未发布用于新型号的系统卡。

image

值得注意的是,DeepSeek坚持开源到最后。这次,DeepSeek-V3模型的开源协议已更新为与DeepSeek-R1一致的MIT协议。该协议更加放松,允许模型蒸馏,商业用途和其他行为,从而使开发人员更加自治。

在性能方面,编程功能的优化已成为最大的亮点,并且新版本的DeepSeek-V3生成前端代码的能力得到了极大的提高。

image

网民要求该模型设计天气页(左由DeepSeek-V3的新版本生成;右右DeepSeek-V3生成了右)

image

image

网民设计了带有新版本的V3的个人网站页面

image

网民使用新版本的V3编写的小型游戏

image

网民使用新版本的V3撰写的文本卡

根据多个博客作者的测试,DeepSeek-V3的新版本在网站开发功能和UI设计方面表现出色。它仅需要简单的文本提示即可快速开发各种网站和应用。它的美学与世界上最强大的封闭源代码模型Claude 3.7十四行诗思维链版本相媲美。

image

image

image

由新版本的DeepSeek-V3生成

image

由Claude 3.7十四行诗生成

image

image

图1 DeepSeek V3一代

image

图2 DeepSeek V3 0324代

image

图3克劳德十四行诗3.7一代

《科学与技术创新委员会》曾经报道了第一代DeepSeek-V3,并且该模型在推出后立即以其成本效益而“闻名”。在多个基准测试中,DeepSeek-V3的得分要比其他开源模型(例如QWEN2.5-72 B和LLAMA-3.1-405 B)更好,并且与世界顶级封闭的源模型GPT-4O和Claude-3.5-Sonnet相当。

在开源论文中,Viague量化强调了其极低的培训成本 - 通过优化和协作设计算法,框架和硬件的协作设计,假设H800GPU的租金价格为每小时每小时2美元,每小时2美元,而DeepSeek-v3的总培训成本仅为557.6万美元(请注意:不包括57.6万美元(请注意),并且不包括57.6万美元的成本,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不包括Deepsek,并且不仅包括57.6万美元。在体系结构,算法或数据上进行消融实验。

DeepSeek-V3 API服务的定价将提高到0.5元的每百万个输入令牌(Cache HIT)/2元(Cache Miss),而每百万元的产量令牌为8元。根据Cache Miss的输入价格,总成本为RMB 10。

在相同类型的型号中,OpenAI的GPT 4O的价格很高,输入为:5/百万个令牌,产出:15/百万美元的令牌,总成本为20美元,约为140元。

_DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?_DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。