新最新

股市

百科

热点
24快讯

APP下载

APP二维码

联系我们

APP二维码

DeepSeek-R1模型超越OpenAI o1，通用人工智能AGI研发商DeepSeek登顶苹果应用商店下载榜

来源：网络作者：日期：2025-01-27 09:21:51

27日，DeepSeek应用登顶苹果中国和美国应用商店免费APP下载榜，超过美国下载榜上的ChatGPT。

硅谷形成过程中的主要影响因素__硅谷影响

_硅谷形成过程中的主要影响因素_硅谷影响

据悉，DeepSeek于2025年1月发布了性能对比OPENAI O1的DEEPSEEK-R1模型正式版。该模型在后训练阶段采用了大规模增强学习技术。在只有很少标签数据的情况下，大大提高了模型的推理能力。

该模型发布后，引起广泛热议。 CNBC 称：“一个鲜为人知的中国人工智能实验室发布了一个人工智能模型，虽然其建设成本较低，但性能超越了美国最好的人工智能模型，从而引发了整个硅谷的恐慌” ”

_硅谷形成过程中的主要影响因素_硅谷影响

1月26日，有消息称DeepSeek闪崩，服务器繁忙。当日16时，上证报记者透露，DEEPSEEK型号可以正常使用。

公开信息显示，DeepSeek旗下企业深入杭州寻求人工智能基础技术研究有限公司，该公司由梁文峰间接控股83.2945%。据悉，梁文峰出生于广东，毕业于浙江大学。此前曾从事量化投资工作。

硅谷影响_硅谷形成过程中的主要影响因素_

硅谷形成过程中的主要影响因素_硅谷影响_

低成本、高性能

DeepSeek-R1模型最显着的特点是性能强、成本低。

公开资料显示，DeepSeek-R1的性能可对标OpenAI O1正式版，但deepseek-R1 API服务定价为每百万产出token1元（缓存）/4元（缓存），token16每百万产出产出代币16元每百万产出产出代币16元精华有业内人士告诉记者，这个收费标准大约是Openai O1运营成本的一-30分之一。

DeepSeek-AI团队的论文表明，DeepSeek R1的关键点在于其创新的训练方法——DEEPSEEK-R1-Zero路线。（RL）用于基本模型，不依赖监督和微调（SFT）和标记数据。

事实上，低成本和高性能一直是DeepSeek模型的“卖点”。

DeepSeek于2024年12月推出Deepseek-V3模型，其多项评估结果超越了Qwen2.5-72B和LLAMA-3.1-405B等其他开源模型，以及全球顶级闭源模型GPT-4O的GPT-4O性能和型号均处于世界领先水平。而Claude-3.5-SONNET不管博中。

值得注意的是，该模型开发仅两个月，投入不到 600 万美元，并且模型训练使用性能有限的 Nvida H800 显卡。相比之下，Meta的LLAMA-3.1-405B训练成本高达6000万美元，使用的计算资源是DeepSeek-V3的11倍。

硅谷影响_硅谷形成过程中的主要影响因素_

在美国匿名职场社区 Temblind 中，Meta 员工曾表示 DeepSeek 的低成本和高效率可以让团队面临预算理性：“生成 AI 开发团队中每个领导者的薪资比整个团队的成本得到更多补偿” DeepSeek-V3 甚至更高，我们有几十个这样的领导者。”

市场反应激烈

DeepSeek-R1模型的发布引起了激烈的讨论。业内人士表示，之所以市场反应如此剧烈，Deepseek的例子说明AI技术并没有明显的“护城河”，模型技术过剩已经成为常态。

微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 在达沃斯世界经济论坛上表示：“DeepSeek 的新模型令人印象深刻。他们不仅有效地开发了一个开源计算合理时的模型，而且计算效率极高。”

经济学家指出，美国目前训练一个大型语言模型需要花费数千万美元，而DeepSeek花费不到600万美元。这种廉价的培训正在随着模型设计的发展改变整个行业，这可能会带来更专业的特定用途模型，打破赢家的市场格局。

此外，AMD宣布DeepSeek-V3模型已集成在Instinct MI300X GPU上，并在SGLANG的帮助下优化了性能。 AMD还表示，此次整合将有助于加速尖端人工智能应用的开发。

硅谷形成过程中的主要影响因素__硅谷影响

DeepSeek的高人气也引起了国内资本市场的关注。相关业内人士表示，人工智能有望在春节前后继续成为资本市场追逐的热点板块。

分类： 股市

地址： http://news.lianzhou.cn/post/7333.html

标签：DeepSeek-R1 强化学习英伟达H800 低成本高效能 Meta员工反馈

责任编辑： admin

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

相关文章：

近日华为公布AI基础设施架构新进展，CloudMatrix 384超节点或终结算力焦虑

特斯拉Optimus人形机器人最新视频曝光：强化学习训练下的稳健步态与自然动作

DeepSeek发布V3-0324模型更新，6850亿参数开源版上线Hugging Face

百度发布文心大模型4.5及X1：多模态理解能力显著提升，性能优于GPT4.5

北京研发团队展示连续后空翻人形机器人N2，技术创新提升稳定性

大模型技术与具身智能结合：推动机器人向更智能形态发展的重要突破

潞晨科技宣布停止DeepSeek API服务，用户需尽快使用余额或申请退款

潞晨科技宣布停止DeepSeek API服务，用户需尽快用完余额并享受全额退款

潞晨科技宣布停止DeepSeek API服务，用户余额将全额退款

DeepSeek开源优化并行策略与英伟达Blackwell架构的DeepSeek-R1模型，实现计算效率与推理速度的大幅提升

DeepSeek API夜间优惠活动：DeepSeek-V3降至50%，DeepSeek-R1低至25%

中国联通利用DeepSeek-R1满血版模型实现难度自适应微调与二次蒸馏优化

微信Windows 4.0.2测试版上线，电脑端可收取红包，腾讯AI应用前景看好

联想AI PC新品发布：天禧AS系统升级，端侧部署DeepSeek 7B大模型引领行业创新

小米超级小爱再升级：DeepSeek-R1模型助力代码编写与文章创作

马斯克Grok语音模式上线，AI集群构建加速，全球AI大战愈演愈烈

2024年中国智能算力规模增长74.1%，市场规模达190亿美元

微信正式接入DeepSeek，AI搜索功能灰度测试开启，腾讯多产品探索新体验

发表评论取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。