DeepSeek新一代AI模型R2即将提前发布,编程与多语言推理能力大幅提升
DeepSeek还有另一个大新闻。
据路透社称,2月25日,DeepSeek计划提前发布其新一代AI Model R2。该公司原定于5月成立,但目前正在尽快启动。 DeepSeek表示,新模型将提高编程功能和多语言推理。
作为回应,与Huanfang量化有关的人对中国证券的记者做出了回应,“官方新闻将占上风”。
此外,阿里巴巴在2月25日晚上完全打开了其视频生成模型Wanxian 2.1模型的来源。
值得注意的是,DeepSeek API开放平台还宣布了2月25日重新开放API充值服务。由于服务器资源紧密,该平台暂停了2月6日API服务的充值功能。
DeepSeek-R2即将到来?
DeepSeek下一代Model R2的进步吸引了市场的广泛关注。
据路透社称,2月25日,DeepSeek计划提前发布其新一代AI Model R2。据熟悉此事的人们说,R2原定于5月初发布,但现在该公司希望尽快推出它。 DeepSeek表示,新模型将提高编程功能和多语言推理。对于R2发布时间表,未提供具体的详细信息。
印度技术服务提供商Zensar的首席运营官Vijayasimha Alilughatta表示:“ DeepSeek的R2模型发布可能是AI行业的关键时刻。DeepSeek成功地创建了成本效益的AI模型,促使全球公司促使全球公司加速R&D并休息并休息,并突破休息,并突破休息趋势。
作为回应,与Huanfang量化有关的人对中国证券的记者做出了回应,“官方新闻将占上风”。
此前,一位在Reddit上发布的行业内部人士,DeepSeek-R1在编码和SWE板凳方面与OpenAI相匹配,甚至没有使用他们最大的突破 - 强化学习(RL),这将要改变。 “他们正在解决这个问题。未来版本将集成拒绝采样和异步评估,使软件工程可用的增强学习。路线图非常清楚:DeepSeek-R2将是一个优化的飞跃,而不是算法飞跃。这就是他们解决优化问题的能力。”
分析师认为,DeepSeek的成功归功于Huanfang投资在过去十年中对研究和计算能力的大量投资。 Huanfang花费了12亿元,在2020年和2021年建立了两个AI超级计算集群,其中包括约10,000个NVIDIA A100芯片。
据熟悉此事的人们说,前DeepSeek员工表示,该公司的成功主要是由于Liang Wenfeng专注于更具成本效益的AI架构。 DeepSeek使用了混合专家(MOE)和长期潜在关注(MLA)等技术,从而大大降低了计算成本。
伯恩斯坦经纪公司的分析师在2月初估计,DeepSeek的价格比OpenAI中的类似车型便宜20至40倍。这也引发了本月Openai的降价,Google的双子座还推出了折扣访问层次结构。自R1推出以来,OpenAI还发布了O3-Mini模型,该模型依赖于较少的计算能力。
此外,DeepSeek API开放平台今天还宣布,它将重新开放API补给服务。此前,由于服务器资源紧密,该平台在2月6日暂停了API服务的充值功能。
阿里巴巴释放视频生成模型
同时,阿里巴巴传来了一个大新闻。
阿里巴巴的综合开源视频生成模型,Wanxian 2.1模型。今年1月,阿里巴巴的Wanxianggang宣布启动2.1版型号升级,视频生成和图像生成功能都得到了提高。
在视频生成方面,Wanxiang 2.1通过其自我开发的有效VAE和DIT体系结构增强了时空上下文建模功能,支持了无限长的1080p视频的有效编码和解码,并意识到了中国文本视频生成的功能第一次,在VBENCH列表中排名第一。
根据先前的介绍,Wanxiang 2.1支持中文和英语视频,可以单击一键产生艺术角色,还提供了各种视频特殊效果选项,以增强视觉表达,例如过渡,粒子效果,仿真等。
借助Wanxiang 2.1模型的开源,这意味着更多的开发人员将能够以低成本获取和使用模型的基础代码,然后使用它来执行与其业务相关的各种视频生成应用程序。
值得注意的是,仅在今天早上,阿里巴巴Qwen团队在社交媒体上宣布,它发布了一种新的推理模式 - 深思熟虑(QWQ)。这是一个基于QWEN2.5-MAX的推理模型,由QWQ-MAX-PREVIEW支持。 QWQ可以同时支持深入思考和网络搜索,并将显示一个完整的思维链。
QWEN团队表示,QWQ-MAX的官方版本将很快发布,Android和iOS应用程序将同时发布,并且可以在QWQ-32B等本地设备上部署的较小型号。
对AI芯片的需求是否高涨?宇宙中最重要的财务报告即将打击
值得注意的是,DeepSeek的兴起曾经使投资者质疑Nvidia的尖端筹码是否仍然是人工智能竞赛中技术公司的“赢得魔术武器”? NVIDIA的市场价值在1月底的一天在一天内蒸发了5930亿美元,这是美国公司单日市场价值的最高损失。
但是,情况并非如此。 DeepSeek的出现引发了许多行业的许多公司采用DeepSeek,这可能会大大增加对Nvidia AI芯片的需求。
据路透社报道,在中国公司推出了低成本的人工智能模型DeepSeek之后,它大大提高了对中国市场中使用的NVIDIA人工智能芯片的需求。路透社引用熟悉此事的人们说,同一H20芯片的命令已经激增。
有两个熟悉此事的人说,自从DeepSeek上个月引起了全球关注以来,中国公司腾讯,阿里巴巴和野蛮人都“大大增加”了H20的订单。除了对高级AI芯片的内部需求外,这三个技术巨头还提供云计算服务,以便其他公司可以获取和使用AI工具。
在周三(2月27日凌晨北京时间)的美国股票市场之后,将发布“宇宙最重要的财务报告”。 NVIDIA,“ AI芯片霸王”将发布其2025财政年度的第四季度绩效报告,截至今年1月底,其对AI芯片的需求成为市场关注的重点。
根据LSEG的数据,NVIDIA的第四季度收入预计将增长72%,至380.5亿美元,这是七个季度的最低增长率。截至今年4月,预计2026财政年度第一季度的收入将增长60%。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。