APP下载
APP二维码
联系我们
APP二维码
返回

国产大模型技术突破:字节跳动UltraMem架构提升推理速度,阿里与苹果合作开发AI功能

来源:网络   作者:   日期:2025-02-12 19:11:42  

2月12日,Bytedance Doubao Big Model团队发布了一条消息,说该团队提出了一种新的稀疏模型架构Ultramem,该建筑可以有效地解决MOE期间的高价值内存访问问题(专家混合物)推断,并且推理速度相对较高。 。 MOE架构提高了2-6次,推理成本可以降低多达83%。

除了bytedongbao外,阿里巴巴和Zhipu AI还报道了新的更新。根据这些信息,引用熟悉此事的人们,Apple和Alibaba将合作为中国iPhone用户开发AI功能。在新闻的影响下,阿里巴巴的美国股票急剧上升,曾经上升超过3%。此外,三星宣布Zhipu的AgenticGLM已成为其新手机Galaxy S25的AI功能的来源。行业分析师表示,苹果与阿里巴巴,三星与Zhipu的合作以及在中国市场的末端AI战争中与AI手机合作将在2025年进入紧张的“针头战”状态。

Doubao提出了一个新的体系结构,以大大降低推理成本

根据Doubao Big Model团队的说法,在大型模型的主流变压器体系结构下,该模型的性能与参数数量和计算复杂性的数量对数。随着大语言模型的规模不断增长,推理成本将急剧增加和减速。尽管MOE体系结构已成功解开计算和参数,但是当推理时,较小的批次化将激活所有专家,从而导致内存访问急剧增加,这将大大增加推理延迟。

为了解决这个问题,Bondedance Doubao Big Model Foundation团队提出了一个新的稀疏模型架构Ultramem。该体系结构还解除了计算和参数,但在确保模型效果的同时解决了推断内存访问问题。

实验结果表明,在相同的参数和激活条件下,Ultramem在模型效应方面超过了MOE,并将推理速度提高了2-6倍。在常见的批处理大小下,Ultramem内存访问的成本几乎等同于具有相同计算量的密集模型的成本。

据了解,最近受欢迎的国内模型团队DeepSeek的主要技术基石是Moe。它的自发展的DeepSeekmoe是一种创新的大规模语言模型架构,通过整合专家混合系统,改善注意力机制和优化的归一化策略来实现模型效率和计算能力之间的新平衡。

随着Doubao Big Model团队提出了新的稀疏模型体系结构Ultramem,大型模型训练推断的成本预计将迅速下降,从而促进大型模型的发展。

国产大模型密集放大招!豆包提出新架构 AI手机两大重磅消息都与国产大模型有关__国产大模型密集放大招!豆包提出新架构 AI手机两大重磅消息都与国产大模型有关

这两个主要的AI手机与国内大型模型有关

根据这些信息,引用熟悉此事的人们,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能,包括图像生成,文本优化,智能搜索等,以增强iPhone在摄影,通知管理和文本处理。在新闻的影响下,阿里巴巴的美国股票急剧上升,曾经上升超过3%。

该报告还说,苹果和阿里巴巴已提交了双方共同开发的AI职能,以供监管机构批准。如果获得批准,中国将成为世界上第一个使用苹果AI功能与当地公司合作的地区。实际上,经常有关于苹果与国内AI模型合作的报道。有报道说百度可能成为苹果的伙伴。也有传言称苹果公司与Tencent,Byte,Zhipu AI,Baichuan和其他公司合作。触碰。

苹果在中国的销售连续两年下降了两年,在2024年第四季度同比下降11%。此举是苹果公司应对中国销售下降的策略之一,旨在通过更具吸引力的人来满足华为软件功能,来自Vivo等本地品牌的竞争对手竞争。

阿里巴巴是国内AI模型的第一级球员。在今年的春季音乐节上,阿里巴巴云汤蒂·Qianwen旗舰模型Qwen2.5-Max正式升级并发布。据他介绍,QWEN2.5-MAX模型是Alibaba Cloud Tongyi团队在MOE模型中的最新探索结果。训练前数据超过20万亿代币,显示出极强的全面性能。它基于许多公共主流模型评估基准记录高分,超过了世界领先的开源MOE模型和最大的开源密集模型。

QWEN2.5-MAX的发布也引发了关于中国AI资产的重估的资本市场的讨论。行业内部人士分析了阿里巴巴云不仅发布了与世界顶级模型相当甚至更好的模型,而且还具有完整的云生态系统,该系统可能形成与去年北美云计算服务提供商相似的投资逻辑。自1月中旬以来,阿里巴巴的美国股市累积增长超过30%。

除了Apple + Alibaba的结合外,三星 + Zhipu之间的合作也引起了市场的关注。 Zhipu和三星基于AgenticGLM合作。三星最新的手机Galaxy S25系列现在可以基于AI支持实时语音和视频通话,并实现视觉理解和系统功能调用,AI搜索,文案和其他功能。 Zhipu的C-End产品Zhi Pu Qingyan和Qingyan智能平台登录到Galaxy S25系列。

负责Zhipu的相关人员说,AgentiCGLM允许Galaxy S25系列处理多模式数据,例如同时使用文本,语音,图像和视频,并且可以使用工具并具有独立行动。例如,Galaxy S25系列的“ Talk and Chat”功能可以启用AI视频调用,以便首次与手机上的用户智能互动。 GLM-REALTIME支持图片和视频输入,可以准确识别图片中的文本和详细信息,流式推理功能会带来低潜伏期。它还具有多发内存功能,可以充当更智能的语音助手,为用户提供流畅的翻译,搜索和其他功能。

“基于最新Galaxy AI的三星Galaxy S25系列手机是全球范围内首款具有视频呼叫功能的本地AI智能硬件产品。我很高兴Zhipu Zhipu AgentiCGLM丰富而多样的AI功能可用于为用户提供无缝嵌入的无缝嵌入式功能系统级别。 Zhipu说。

行业内部人士通常认为,随着诸如DeepSeek之类的国内大型模型推动了大型模型的成本急剧下降,预计它将促进终端AI的加速发展,并推动更终端设备(例如智能手机)(例如智能手机)的智能功能集成智能家居设备和智能可穿戴设备。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。