深度求索发布开源大模型DeepSeek-R1，低成本高性能引领全民AI时代

来源：网络作者：日期：2025-02-16 11:11:45

最近，中国人工智能（AI）公司DeepSeek发布的开源Big Model DeepSeek-R1已在世界各地流行，引起了该行业的热烈讨论：所有人的AI时代是否到达？

在过去的两年中，由OpenAI代表的美国公司推出并领导了人工智能大型模型的投资浪潮。由于不乏芯片和计算能力，因此其主流想法是“越大越好” - 具有更强的计算能力和更多的数据训练更大的模型以实现更高的性能。这使大型模型消耗了巨大的能量，培训成本令人惊讶，这也带来了商业促销问题：大型模型无法投资，小型模型不容易使用。

DeepSeek改变了这种模式。他们在模型体系结构和培训过程中进行了深入的优化，尽管大大减少了计算资源的消耗，但它们是世界上最高的AI模型之一，既可以实现“低成本”和“高性能”。同时，与Openai的封闭源战略相反，DeepSeek为免费的，明确揭示了所有技术路线的自由开设了大型模型，从而进一步促进了大型模型技术从“奢侈品”转换为“每日商品”。

从技术进步的角度来看，低成本的开源模型已经打开了新的竞争轨道，AI的未来更值得期待。

低成本是技术普及的基本要求，只有通过负担得起的购买，成千上万的家庭才能使用它。汽车，个人计算机和手机的普及就是这种情况，人工智能行业可能也不例外。近年来，业务和技术界已做出了很多努力来降低大型模型的成本。 DeepSeek模型是一项杰出的成就，证明“这条路是可以使用的”。

但是大型模型的价格尚未下降到底部。在降低成本和提高效率的道路上，DeepSeek不是终点，而是一个新的起点。开源代码，Open API（应用程序编程接口）和培训方法吸引了全球开发人员参与技术迭代。 1月20日R1推出后，来自各个国家的AI技术人员展开了“ DeepSeek Reprance Boom”。一名美国科学研究团队声称，该模型仅以几十美元租用云计算资源后就进行了复制。

DeepSeek使用专家Hybrid Architecture Moe实现了更高的成本效益。 2月12日，Bytedance Doubao Big Model团队宣布推出新的稀疏模型Architecture Ultramem，该团体优化了推理性能，与MOE架构相比，推理速度提高了2至6倍，并最多将推理成本降低了83倍％。

经济日报：DeepSeek能否开启全民AI时代_经济日报：DeepSeek能否开启全民AI时代_

从业务应用程序的角度来看，DeepSeek重塑了AI生态系统链，并且大型模型具有巨大的业务潜力。

一方面，领导美国的AI公司夸大了开源AI的安全风险，并努力通过监督抑制开源AI。另一方面，他们使用巨额投资来提高大型型号的入境门槛。这形成了“金字塔”生态系统，技术巨头的垄断以及中小型企业依靠API。

开源模型对全球AI供应链至关重要，绝大多数发展中国家尤其需要开源AI技术。开源模型允许每个开发人员轻松地调用强大的AI工具，而不再受大公司的束缚，并且AI的进化速度和受欢迎程度得到了显着改善。

最近几天，与DeepSeek模型相关的上市公司的公告淹没了屏幕，这使人们惊呼“所有上市公司都在与DeepSeek建立联系”。这反映了市场对低成本，高性能开源模型的渴望。当各行各业的开发人员在开源框架上构建各种应用程序，例如创建文本，智能客户服务，医学成像诊断等。就会出现新的生态系统。

当然，仍然存在许多挑战，可以为所有人带来AI时代。开源模型依赖社区的贡献，有必要建立一种激励机制来避免分裂，并在开源和商业化之间取得平衡，以促进生态系统的可持续发展。为了使AI适应智能眼镜和手机等电脑计算设备，我们需要更好的模型压缩技术。一般模型容易在垂直方案中“熟悉”，并且需要自定义以与行业知识库相结合。我们必须加快行业数据共享和安全标准的制定。为了防止算法歧视和就业影响，我们还必须加强AI伦理教育并建立“技术与法律社会”的协作治理框架。

人工智能是领导未来行业的技术。我们不仅必须是技术突破，还必须统治重建者，并使人工智能模型从“精英游戏”变为“国家股息”。

分类： 股市

地址： http://news.lianzhou.cn/post/8647.html