450阅读
1回复

[数码讨论]华为昇腾 384 超节点发布：实现业界最大规模高速总线互联超节点[1P] [复制链接]

上一主题下一主题查看指定楼层

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 218017

金币: 659852

道行: 2006

原创: 2444

奖券: 3260

斑龄: 41

道券: 1203

获奖: 0

座驾

设备

摄影级

在线时间: 47436(小时)
注册时间: 2008-10-01
最后登录: 2026-01-12

只看楼主倒序阅读使用道具楼主发表于: 2025-05-26

IT之家 5 月 25 日消息，2025 年 5 月 23 日，在鲲鹏昇腾开发者大会 2025 —— 昇腾 AI 开发者峰会上，华为推出了昇腾超节点技术，成功实现业界最大规模的 384 卡高速总线互联。

当前，大模型发展呈现参数与效率交替演进的态势：一方面，Scaling Law 不断推动模型能力突破极限；另一方面，以 DeepSeek 为代表的创新架构与工程技术，正加速模型能力在千行万业的落地应用。在此背景下，MoE 成为主流模型结构，其复杂的混合并行策略带来巨大挑战，TP、SP、EP 单次通信量高达 GB 级且难以掩盖。随着并行规模持续扩大，传统服务器跨机带宽已成为训练的核心阻碍，亟需计算架构的创新升级以适配未来模型发展。

传统服务器依赖以太网络实现跨机互联，通信带宽较低。实践表明，当 TP、SP 或 EP 等分布式策略的混合并行域超过 8 卡时，跨机通信带宽便成为性能瓶颈，导致系统性能大幅下降。

据介绍，华为昇腾超节点打破了以 CPU 为中心的冯诺依曼架构，创新提出了对等计算架构，凭借高速总线互联技术实现重大突破，把总线从服务器内部，扩展到整机柜、甚至跨机柜。在超节点范围内，用高速总线互联替代传统以太，通信带宽提升了 15 倍；单跳通信时延也从 2 微秒做到 200 纳秒，降低了 10 倍，使集群如同一台计算机般协同工作，有效突破系统性能限制。

IT之家从华为中国官方获悉，此次推出的昇腾 384 超节点，由 12 个计算柜和 4 个总线柜构成，是目前业界规模最大的超节点。依托华为在 ICT 领域深厚的技术与工程经验，通过最佳负载均衡组网方案，该超节点可进一步扩展为包含数万卡的 Atlas 900 SuperCluster 超节点集群，为未来更大规模的模型演进提供支撑。

性能测试数据显示，在昇腾超节点集群上，LLaMA 3 等千亿稠密模型性能相比传统集群提升 2.5 倍以上；在通信需求更高的 Qwen、DeepSeek 等多模态、MoE 模型上，性能提升可达 3 倍以上，较业界其他集群高出 1.2 倍，在行业中处于领先地位。

山庄提示：道行不够，道券不够？---☆点此充值☆

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 218017

金币: 659852

道行: 2006

原创: 2444

奖券: 3260

斑龄: 41

道券: 1203

获奖: 0

座驾

设备

摄影级

在线时间: 47436(小时)
注册时间: 2008-10-01
最后登录: 2026-01-12

只看该作者沙发发表于: 2025-05-26

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

　　华为在2025年5月23日的鲲鹏昇腾开发者大会2025——昇腾AI开发者峰会上推出的昇腾超节点技术，是一项重大的技术突破。这项技术成功实现了业界最大规模的384卡高速总线互联，对大模型发展具有重要意义。随着大模型参数和效率的交替演进，以及MoE成为主流模型结构，混合并行策略带来的挑战日益增加，特别是在大规模并行计算中，传统服务器的跨机带宽已成为性能提升的瓶颈。

　　华为昇腾超节点技术的推出，打破了传统的以CPU为中心的冯诺依曼架构，提出了对等计算架构。这一架构通过高速总线互联技术，将总线从服务器内部扩展到整机柜甚至跨机柜，极大地提升了通信带宽和降低了通信时延。具体来说，通信带宽提升了15倍，单跳通信时延从2微秒降低到200纳秒，降低了10倍，这使得集群能够像一台计算机一样协同工作，有效突破了系统性能的限制。

　　昇腾384超节点由12个计算柜和4个总线柜构成，是目前业界规模最大的超节点。依托华为在ICT领域的深厚技术与工程经验，该超节点可以通过最佳负载均衡组网方案进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群，为未来更大规模的模型演进提供支撑。

　　性能测试数据表明，在昇腾超节点集群上运行的LLaMA 3等千亿稠密模型性能相比传统集群提升了2.5倍以上；对于通信需求更高的Qwen、DeepSeek等多模态、MoE模型，性能提升可达3倍以上，较业界其他集群高出1.2倍，处于行业领先地位。这表明华为昇腾超节点技术在提升大模型性能方面具有显著优势，对于推动AI技术的发展和应用具有重要意义。

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[数码讨论]华为昇腾 384 超节点发布：实现业界最大规模高速总线互联超节点[1P] [复制链接]