APP下载
APP二维码
联系我们
APP二维码
返回

蚂蚁集团运用国产AI芯片高效训练大模型,显著降低开发成本

来源:网络   作者:   日期:2025-03-24 16:05:50  

蚂蚁小组使用国内AI芯片来训练大型型号,并且可以进一步降低成本。

最近,蚂蚁小组的Ling团队发表了一篇有关技术成就的论文。该论文表明,蚂蚁组已经推出了两个不同尺度的大型语言模型 - ling-lite和ling-plus。前者的参数量表为168亿(激活参数为27.5亿),加基基本模型参数量表高达2900亿(激活参数为288亿),并且两者的性能达到行业领先水平。

除了具有领先绩效的自我开发的大型模型外,该技术论文的最大突破在于提出一系列创新方法,以提高资源受限环境中AI开发的效率和可访问性。实验表明,它的3000亿参数MOE(混合专家)可以使用国内GPU在低绩效设备上有效训练大型模型,并且其性能与NVIDIA芯片的完全使用,相同规模和MOE模型的密集模型可媲美。

自我开发的大型模型,用于在低绩效硬件上有效培训

目前,蚂蚁集团Ling团队的Ling团队的技术成就论文“每个翻牌都是至关重要的:可以扩展没有高级GPU的3000亿参数”在Preprint Arxiv平台上发布。

图片

根据技术成就的论文,尽管DeepSeek,Alibaba Tongyi Qianwen,Minimax和其他系列的MOE大型模型在特定任务中表现出色,但MOE模型的培训通常依赖于高性能计算资源(例如高性能的GPU(例如NVIDIA H100/H800)等高级GPU,以及高成本的限制性限制性限制的环境。同时,NVIDIA近年来继续缺乏高性能芯片。相反,低性能加速器更实惠,独立成本较低。这种差异突出了需要建立一个技术框架,以在跨分类计算单元和分布式簇之间进行无缝切换。

因此,Ling团队设定的目标是“不使用先进的GPU”来扩展模型,并提出旨在破坏资源和预算限制的创新培训策略,以实现有效的大语言模型培训,从而促进AI技术发展朝着普遍化的发展。

具体而言,团队提出的创新策略包括:1)创新的体系结构和培训策略:动态参数分配和混合精度调度技术; 2)升级训练异常处理机制:自适应断层恢复系统缩短了中断响应时间; 3)模型评估过程的优化:自动化评估框架的压缩验证周期超过50%; 4)工具呼叫功能的突破:基于知识图的指令进行微调提高了复杂任务的执行精度。

根据技术论文,Ling团队在五个不同的硬件配置上预先训练了9万亿个令牌。使用高性能硬件配置1万亿代币的培训前培训成本约为635万元人民币。但是,在使用ANT的优化方法之后,使用低规格硬件的培训成本将减少到约508万元人民币,节省了近20%,并最终实现了与阿里巴巴Tongyi Qwen2.5-72B教学和DeepSeek-deepSeek-v2.5-1210-Chat可比的性能。

以前,DeepSeek使用一系列算法创新和工程优化来训练V3和R1,通过一系列算法创新和工程优化,以较低的性能与顶级模型相当,为大型型号培训开辟了一条新的途径,为更多的公司和研究机构提供了更多的公司和研究机构,以降低成本和提高成本和提高成本和提高成本。如果对Ant Group的技术成就得到了验证和促进,则意味着国内大型模型可以找到国内筹码或其他成本较低和较高效率的替代方案,以进一步降低其对NVIDIA芯片的依赖。

蚂蚁研发效能__蚂蚁芯片哪里生产

蚂蚁继续增加对AI应用和人形机器人的投资

记者了解到,作为Ant Group的一个自我开发的大型模型,Bailing Big Model的重点是生活服务,金融服务,医疗和健康方案的应用。去年5月,ANT在开放日展示了几种创新的AI应用程序产品,并首次宣布了AI应用程序矩阵。 Ant Group的首席执行官Zhengyu透露,基于Ant Bailing Big Model的三个申请是Ant目前的主要突破指示:救生员,医疗助理和财务助理。

3月21日,ANT宣布了AI医疗护理领域的最新进展:针对医疗机构,医生和用户启动AI产品系统的升级。其中,对于医疗机构,我们与华为医疗和健康团,阿里巴巴云,苹果等共同推出了“蚂蚁医疗大型模型”全栈解决方案。对于医生,我们发布了AI医生助理系列工具;同时,用于用户健康应用程序的“ AI健康经理”还推出了十多种新功能,例如智能思维和健康自我测试。

除AI外,ANT最近还在类人形机器人领域进行了频繁的移动。今年2月,来自招聘平台的信息表明,蚂蚁集团(Ant Group)招募了诸如具体智能的人形机器人系统和应用等职位,年薪高达一百万元。早在去年12月,Ant Group就注册并建立了上海Ant Lingbo Technology Co.,Ltd。,重点介绍了压纹智能技术和产品研发。

根据Pudong的说法,3月11日,上海Ant Lingbo Technology Co.,Ltd.在上海Pudong举行了揭幕仪式。据报道,Ant Lingbo Technology是Ant Group扩展其体现的情报和机器人业务的主要运营商,并致力于在家庭,老年护理,医疗和健康领域创建行业领先的机器人产品。该实施将与Pudong合作,以在未来的新工业轨道上促进和寻求发展,帮助Pudong加速技术领导力,工业凝聚和工业升级的步伐,并创建一个具有体现的智能创新高地,并具有由人类机器人领导的创新工业生态系统。

作为一个新兴领域,体现的智能人形机器人具有广泛的市场前景和巨大的业务潜力。蚂蚁小组可能希望通过布置这一领域来探索新的增长点,并促进人类互动的新经验。此外,具体的智能人形机器人技术还可以与Ant Group现有的金融技术业务产生协同作用,共同促进技术创新和业务升级。

行业内部人士分析了体现的智能人形机器人是一个新兴领域,并且具有广泛的市场前景。 Ant Group在该领域的布局将有助于探索新的增长点,并根据其在人工智能,大数据,云计算等方面的技术优势以及现有的业务布局,加速人类机器人的研究和开发及其在相关业务方案中的应用。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。