您的当前位置:首页>科技咨询>资讯详情

华为云黄瑾:传统计算架构难支撑AI代际跃迁,超

发表于:2025-05-16 23:00:19 浏览:11次 发布者: 网易互联网

新京报贝壳财经讯(记者韦博雅)5月16日,在华为云AI峰会上,华为云副总裁黄瑾表示,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁,超节点架构的诞生不仅是技术的突破,更是以工程化创新开辟AI产业的新路径。

黄瑾表示,AI算力的瓶颈,从单卡算力的瓶颈到单机内总线带宽的瓶颈,再到现在集群间通信带宽的瓶颈,需求增长了1万倍。然而过去的8年里,单卡硬件的算力增长了40倍,但是节点内的总线带宽只增长了9倍,跨节点的网络带宽只增长了4倍,这使得集群网络通信成为当前大模型训练和推理的最大挑战。

黄瑾介绍,华为云推出的CloudMatrix 384超节点,直面通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战,通过新型高速互联总线实现384张卡互联成为一个超级云服务器,最高提供300Pflops的算力规模,比英伟达NVL72 180Pflops的算力规模提升了67%。

同时,华为云CloudMatrix 384超节点具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势。

在CloudMatrix 384超节点的分布式推理平台的加持下,通过高速互联总线,能够实现一卡一专家高效分布式推理,单卡的MoE计算和通信效率大幅提升。而MatrixLink服务具有两层网络:超节点内部的ScaleUp总线网络和跨超节点间的ScaleOut网络,可以让超节点内384张卡高速互联,时延低至微秒。

除此之外,华为云首创的EMS弹性内存存储,通过内存池化技术,实现显存和算力解绑,可大幅提升资源利用率、性能和吞吐量,比如用EMS替代NPU中的显存,可使得首Token时延降低,最高降幅可达80%;昇腾云脑运维“1-3-10”标准还将硬件故障感知率从40%提升至90%。

编辑 岳彩周

校对 穆祥桐

猜你喜欢

早资道 | 腾讯元宝中国区苹果应用商店下载量登
早资道 | 腾讯元宝中国区苹果应用商店下载量登
发表于:2025-03-04 浏览:16 发布者: 网易互联网
先进 OTP IP 赋能高安全性 SoC 设计:构建抗篡
先进 OTP IP 赋能高安全性 SoC 设计:构建抗篡
发表于:2025-05-29 浏览:7 发布者: 网易互联网
国家超算互联网平台已上线DeepSeek多款大模型
国家超算互联网平台已上线DeepSeek多款大模型
发表于:2025-02-05 浏览:17 发布者: 网易互联网
百度、微信接入DeepSeek
百度、微信接入DeepSeek
发表于:2025-02-17 浏览:21 发布者: 网易互联网
隐秘跨境增长渠道,联盟营销背后的3000亿美元电
隐秘跨境增长渠道,联盟营销背后的3000亿美元电
发表于:2025-04-11 浏览:14 发布者: 网易互联网
京东网购开箱验货后 商家却以塑封膜损坏拒退货
京东网购开箱验货后 商家却以塑封膜损坏拒退货
发表于:2025-03-14 浏览:13 发布者: 网易互联网
更优商品、更新体验!第七届双品网购节南京都市
更优商品、更新体验!第七届双品网购节南京都市
发表于:2025-04-30 浏览:10 发布者: 网易互联网
美国半导体级多晶硅制造商Hemlock将获3.25亿美元补贴
美国半导体级多晶硅制造商Hemlock将获3.25亿美元补贴
发表于:2024-10-26 浏览:47 发布者: 芯智讯
讯飞星火落地六大车企!端侧大模型年内可用,打响规模落地战
讯飞星火落地六大车企!端侧大模型年内可用,打响规模落地战
发表于:2024-10-26 浏览:71 发布者: 网易新闻
消息称谷歌将停止Android开源项目
消息称谷歌将停止Android开源项目
发表于:2025-03-27 浏览:14 发布者: 网易互联网