蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源

蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源快讯

IT之家 2025-03-24 16:42

分享到：

导读

大模型训练成本有关消息，其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练，百灵轻量版参数规模为 168 亿（激活参数 27.5 亿）。

3 月 24 日消息，据新浪科技报道，针对有关蚂蚁“百灵”大模型训练成本有关消息，蚂蚁集团回应称，公司针对不同芯片持续调优，以降低 AI 应用成本，目前已经取得一定进展，也将逐步通过开源分享。

附事件背景：

近日，蚂蚁集团 Ling 团队在预印版 Arxiv 平台发表技术成果论文《每一个 FLOP 都至关重要：无需高级 GPU 即可扩展 3000 亿参数混合专家 LING 大模型》，宣布推出两款不同规模的 MoE （混合专家）大语言模型 —— 百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），并提出一系列创新方法，实现在低性能硬件上高效训练大模型，显著降低成本。

百灵轻量版参数规模为 168 亿（激活参数 27.5 亿），增强版基座模型参数规模高达 2900 亿（激活参数 288 亿），性能均达行业领先水平。实验表明，其 3000 亿参数的 MoE 大模型可在使用国产 GPU 的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及 MoE 模型相当。（清源）

模型参数性能百灵规模

分享到：

1.TMT观察网遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2.TMT观察网的原创文章，请转载时务必注明文章作者和"来源：TMT观察网"，不尊重原创的行为TMT观察网或将追究责任；
3.作者投稿可能会经TMT观察网编辑修改或补充。

蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源快讯

领潮设计豪华美学艾瑞泽8 PRO新车造型全网首曝

阿里大文娱万兴科技等联合启动北京首个AIGC视听产业创新中心

国货美妆品牌站上C位，抖音618大促期间相关产品销量同比增长53%

高德企业用车：全面接入“三大保镖”，打造优质乘车新体验

抖音电商发布2024非遗发展数据报告：非遗传承人带货销量增长249%

哈啰发布年度可持续发展暨ESG报告，累计减碳超1310万吨

同程旅行设立500家“高考能量站”，近百家线下门店参与

揭秘！容声560WILL养鲜平嵌冰箱如何以实力圈粉