随着人工智能(AI)模型规模的持续扩展,智能计算芯片和计算功率节点之间的通信带宽不足的问题变得越来越突出。传统的电子互连方法不再能够满足高速,大容量和高效数据交换的GPU群集,超级计算中心和云计算平台的需求。特别是在训练大型模型期间,需要在计算节点之间经常传输大量参数。互连带宽不足不仅会降低系统响应速度,而且甚至可能导致停机时间,从而严重影响计算效率和用户体验。如何从带宽和能量消耗方面打破电...
最令人期待的DeepSeek“开源周”来了。2月24日,DeepSeek打开了第一个代码基flashmla。据了解,这是DeepSeek的高效MLA(多头潜在注意力)对料斗GPU进行了优化的内核,该核心专门用于处理可变长度序列,现在正在生产中。上周四,DeepSeek宣布将在本周举行“开源周”活动,连续开设五个代码库,这引发了所有人的期望。作为“开源周”的第一枚炸弹,FlashMLA为该...
10月18日,一则消息在多个微信群流传:“某领先厂商的大规模模型训练被实习生黑客攻击,注入破坏性代码,导致其训练结果不可靠,可能需要重新训练。”被泄露的代码被注入了8000多张卡中,造成的损失可能超过数千万美元。”对此,证券时报e公司记者联系字节跳动,但截至发稿未得到回复。不过,接近字节人士向e公司记者透露,实习生确实破坏了AI模型训练,但损失金额和处理方式被夸大。面临安全管理问题据...
东数西算政策推动数据中心产业高质量发展,光伏概念股集体拉升
2024年A股市场回顾:全年涨幅、最牛板块及个股分析
2025年中国市场展望:贝莱德、富达、瑞银等机构看好中国宏观经济与股市表现
2024年公募基金四季报出炉:军工板块成投资新宠,基金经理全面调整重仓股
A股成交跌破万亿元创924行情新低,资源股全线走强,有色金属获32亿主力资金净流入
A股早盘冲高后震荡,创业板指涨超2%,煤炭石油等资源股集体上扬
2025年A股市场首次大反攻:沪指涨超2%收复3200点,北证50指数暴涨超10%
1月17日股市行情:三大指数震荡上行,PCB行业受益AI产业链发展
中证A500指数基金规模突破3200亿元,市场认可度创新高
10 月 18 日 A 股全线大涨,科技板块全面爆发,成交再上两万亿元
国庆假期港股暴涨,内地城商行板块异动,多只银行股涨幅惊人
国庆档电影票房大战:多部影片竞争激烈,基金经理解读投资逻辑
2025年银行存款利率趋势分析:中小银行逆势上调,未来或将进一步下行