APP下载
APP二维码
联系我们
APP二维码
返回

DeepSeek影响力破圈,无问芯穹获7家国产芯片企业支持优化DeepSeek-R1、V3

来源:网络   作者:   日期:2025-02-12 18:11:14  

好消息是,DeepSeek-R1和V3的“全血版本”正在获得第三方平台的越来越多的支持。

11日,上海AI基础设施公司Wuwen Xinqiong宣布,它已获得七家国内芯片公司的大力支持,并正在将DeepSeek-R1和V3连接到Biren Technology,Haiguang Information,Haiguang Information,Huawei Ascend,Moore Thread,Mu XI,Mu XI和Suiyuan Technology Multii Mul XI和Suiyuan Technology Multii Mul XI - 芯片适应优化的7个硬件平台,例如天舒智能。开发人员现在可以通过一键单击一键通过Wuwen Xinqiong Infini-ai异质平台获得DeepSeek系列模型和多种差的国内计算功率服务。

自从春季前夕,DeepSeek吸引了30多家国内云服务提供商和近20个芯片公司来宣布访问权限以来。随着Wuwen Xinqiong宣布已获得7家国内芯片公司的支持,并以多芯片适应DeepSeek-R1进入市场,DeepSeek具有可控制的国内计算能力的历史机会变得更加清晰。

谁最好回答同样的问题?

DeepSeek是一个出色的商业试验领域,它激发了对推理计算能力的巨大需求。几乎主流的云制造商宣布将提供R1型号服务,但是在整个网络中不忙碌的服务中找到“全血版本”并不容易。

过去,国内AI芯片声称支持大规模模型部署,但实际用户并不多。现在,DeepSeek等于向AI芯片公司提出相同的测试问题:您是否“来”?

在短时间内,有20家国内AI芯片公司急于适应或推出DeepSeek模型,以抓住这一千载难逢的增长机会。这仅反映了当前AI基础架构的特征:芯片和计算资源可用,但没有有效地利用它们。

如何使大量具有不同体系结构的国内芯片有用且易于使用,并在使用过程中形成硬件和算法之间的远期周期? Wuwenxinqiong的策略是制作“异质云”,即协调模型和计算能力要求,整合散布在不同地方的异质计算能力,并实现不同模型和不同硬件之间的统一部署和关节优化。提供给需要计算能力和模型的客户。

去年7月,Wuwen Xinqiong在该行业中首次在该行业中获得了4+2个核心的异质混合训练(Tianshu智能核心,Huawei Ascend,Mu Xi,Moore Thread和AMD),首次使用集群计算,并获得了一个千倍的核心(Tianshu智能核心,Huawei Ascend,Mu Xi,Moore Thread和AMD,Nvidia)电力最大利用率达到97.6%,其运营计算能力覆盖了全国13个以上的城市。

“当前的生态环境需要一个对算法,硬件和模型有深入了解的团队。WuwenXinqiong具有如此全堆栈的垂直优化功能。” Wuwen Xinqiong的联合创始人兼首席执行官Xia Lixue说。

加速国家生产AI行业的封闭环路

Xia Lixue说,DeepSeek的突破激发了越来越多的下游应用程序的创造力。将来,该行业的平均每日代币消费将达到1万亿个水平,这不仅会刺激市场对国内芯片的需求,而且还为国家生产AI行业创造了封闭式循环。 ,实现独立计算能力的更可控制的发展已经创造了有利的条件。

记者了解到,在美国,模型,系统和芯片的三个关键因素已经形成了闭环生态系统。尽管大多数国内大型模型都是通过外国筹码(例如NVIDIA)获得的,并且很难与国内系统和芯片形成闭环。

“作为一种开源模型,DeepSeek处于AI 2.0时代,就像移动互联网革命中的Android一样,它将重建整个工业生态系统,触发链反应,加快上层应用程序的开发和“统一” “低级系统的增长率,因此,我们将采用一种跨越软件,硬件以及上游和下游的生态,并增加对国内模型模型芯片芯片家庭系统的协作优化和垂直连接的投资。”夏利克斯说。

在这方面,Wuwen Xinqiong提出了一种“三步”模型,以促进国家生产AI行业的封闭环路的开放 - 进行基于主流芯片的极端软件和硬件协作优化,并使用有限的计算能力来实现国内赶上外国模型的模型功能;促进国内生产开放芯片的基本生态系统,建立一个“异质”的AI系统来解决计算功率差距,并实现模型能力追赶;建立一个国内“同构”系统,以支持扩展法的可持续发展,并创建一个国家“国内模型家庭模型芯片家庭系统”,AI行业已关闭,以实现对独立计算能力的更可控制的开发。

夏·利克斯(Xia Lixue)说,在打破计算能力封锁的道路上,DeepSeek取得了成功的一步。国家生产AI的下一条道路“国内模型 +国内计算能力 +国内云服务 +国内应用”取决于工业链。上游和下游的生态伙伴共同努力。

柔软和硬的协调优化是不可避免的路径

DeepSeek的大型语言模型发布了3个主要版本,参数量表从67B扩展到236B,再到今天的671B。使用的训练计算能力并未随着模型大小而成倍增加。核心是使用软件和硬件协作。设计的想法不断改善系统开销 - 即,模型培训成本的转换率对模型尺寸和功能。

记者了解到,软件和硬件协作优化是连接硬件和算法的桥梁。它不同于各种算法级优化方法和迭代硬件本身的方法。取而代之的是,随着硬件的变化,软件会根据软件不断优化或迭代。定义未来的基础电路实现,以更好地支持AI算法的操作。

行业内部人士指出,DeepSeek通过软件和硬件协作协调降低计算功率成本,这给了国内灵感,这种方法可以破坏当前的闭环生态瓶颈。

武文·新奇(Wuwen Xinqiong)的核心技术团队早在2018年就总结了“深度学习算法兼容芯片联合设计”路线,并致力于人工智能方案中的能效电路和系统设计方法的研究。它在柔软而坚硬的路线上。早期的先驱者之一。自成立以来,依靠“多元异质性,软合作协作”的核心技术优势,这是一种连接“ M模型”和“ N芯片”的“ M×N” AI基础架构的新范式。

在蛇的春季节期间,DeepSeek和“ Nezha:Devil Child的麻烦”两匹“黑马”扭转了中国公司不如其他公司的偏见,并且也证明了只要它们具有强大的力量,他们将在不区分国家边界的情况下为他们表示赞赏。两天前,我们的报纸报道说:“国际权威技术商业智囊团还要关注中国人工智能初创公司的四家新AI公司,除了DeepSeek之外,包括Wuwen Xinqiong”。一些分析人士认为,DeepSeek使国际社会意识到,除了DeepSeek外,中国还拥有几支具有独特道路的球队。除了使用“强大的砖”飞行之外,还没有发现巨大的比赛。五角大楼战略家正在关注软件和硬件,将上游和下游存放的“盲点”,并采取一条技术道路,这可能会导致惊喜胜利。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。