HBM,何以成为AI角力关键?_新闻中心_苏州超集信息科技有限公司

400-860-6560

新闻中心 HBM,何以成为AI角力关键?
HBM,何以成为AI角力关键?
2025.10.23

三星电子近日宣布,其12层第六代HBM4内存将于10月底正式发布,现已进入研发冲刺阶段,并计划今年晚些时候量产。这一动作无疑为2025年本就爆发式增长的HBM市场再添一把烈火。


为什么HBM年增速能突破200%,达到68亿美元全球市值,成为AI赛道的"战略石油"。 今天,超集信息带您透视HBM的底层逻辑:从打破"存储墙"到决定大模型训练速度,它如何悄悄掌控AI算力的生死线。

HBM,何以成为AI角力关键?(图1)

驱动GPU性能跃升


HBMGPU的性能提升,本质是解决了传统内存(如GDDR6DDR5)的"带宽瓶颈"——GPU计算核心的算力(如 FP8 算力达 1-2 PFLOPS)已远超内存数据供给能力,导致 "算力闲置"GPU 等待数据加载)。HBM通过三大技术升级打破这一桎梏:

01

带宽革命性提升

Bandwidth

当下的HBM3E,采用12层(部分厂商已实现14层)3D堆叠工艺,单颗裸片带宽达1.2TB/sHBM3 0.8TB/s),单栈容量提升至24GBHBM316GB)。当下旗舰GPU通常搭载8HBM3E总带宽达5-6TB/s(较HBM3提升约24%),是GDDR64-5倍(GDDR6单卡带宽约 1-1.5TB/s)。


这意味着GPU每秒可读写5-6TB数据,足以匹配其万亿次级的计算能力,从"计算等数据"变为"数据追计算"

02

容量&带宽协同优化

Memory

当前,通过HBM3E技术,NVIDIA将旗舰GPU显存堆叠至192GB,下一代产品Rubin更将基于HBM4提升至惊人的288GB大显存配合高带宽,使GPU可直接加载更大的模型参数(8卡单机即可实现百亿模型的完整加载)、更高分辨率的特征图(如8K图像的1024通道特征图约32GB),避免传统"数据分块"导致的30%-50%效率损失(分块需额外计算边界填充、参数同步)。

03

能效比结构性优化

Energy

HBM3E通过TSV(硅通孔)技术缩短数据传输路径,GB带宽功耗降至0.3WHBM30.4WGDDR60.8W),同等带宽下功耗降低25%-50%这使GPU在相同散热条件下可维持更高的Boost频率,进一步放大算力输出。

多场景下性能真实跃升


1、 AI 大模型训练:25%-50%的效率提升


大模型训练的核心瓶颈是"参数与特征图的实时传输"HBM3E的高带宽直接减少"数据等待时间"


· 千亿参数模型(如Llama 3 70B):141GB HBM3E GPU训练时,单卡每轮迭代时间从80GB HBM3 GPU180秒压缩至120秒,效率提升33%;若采用8卡系统,因HBM3ENVLink协同带宽更高(900GB/s),集群效率从82%提升至91%,总训练周期缩短40%


· MoE 混合专家模型(如GPT-4 MoEMoE的稀疏激活特性需频繁读取不同专家层参数,HBM3E1.2TB/s 单栈带宽使专家切换延迟从HBM380 μs降至50μs,单卡吞吐量提升25%,同等算力下可支持的专家数量从64扩展至128


2、高分辨率视觉处理:30%-60%的速度跃升


高分辨率图像/视频处理(如8K分割、3D医学影像重建)对"大尺寸特征图读写" 需求极高,HBM3E的大容量+高带宽可避免分块处理:


· 8K图像分割(如卫星遥感影像):处理17680×4320的图像时,ResNet-152 模型的特征图需占用约48GB显存,HBM3128GB)需分2块处理(额外耗时30%),而HBM3E192GB)可单块处理,端到端时间从120ms压缩至70ms,提升42%


· 3D医学影像重建(512×512×512体素):3D U-Net 模型的中间特征体素需占用64GB显存,HBM3因容量不足需分8个子块(误差累积+分块耗时),而HBM3E可全量加载,重建精度从92%提升至95%,同时速度提升58%(从5分钟压缩至2分钟)。

3、多模态实时推理:20%-35%的延迟降低


多模态推理(如文本-图像生成、自动驾驶感知)需同时处理异构数据(文本token、图像像素、点云坐标),对带宽实时性要求苛刻:


· Stable Diffusion XL图像生成(1024×1024):生成1张高清图像需加载文本编码器(3GB)、图像解码器(8GB)、交叉注意力层(5GB),HBM3E的高带宽使数据加载延迟从HBM3150ms降至90ms,单图生成时间从2.5秒压缩至1.8秒,提升28%


· 自动驾驶BEV感知(114K摄像头+激光雷达):每秒需处理1.2GB数据(图像+点云),HBM3E5.3TB/s 带宽可实现数据"零等待",感知延迟从HBM380ms降至50ms(满足L4级自动驾驶的安全阈值),同时目标检测准确率提升3%(减少数据截断导致的特征丢失)。


4、科学计算:15%-40%的算力利用率提升


计算流体力学(CFD)、分子动力学等科学计算依赖 "大规模矩阵运算 + 中间结果读写"HBM3E的带宽可提升算力利用率:


· 分子动力学模拟(100 万原子体系):每步模拟需读写8GB原子坐标与力场数据,HBM3E的带宽使数据IO时间从HBM3200ms降至120msGPU算力利用率从65%提升至85%,单日模拟步数从1200步增至1800步,提升50%


HBM,何以成为AI角力关键?(图2)

HBM技术GPU结合后带来的性能跃升,本质是"算力-带宽"匹配度的质变:在数据密集型场景中,综合性能提升20%-50%,部分场景突破100%;更重要的是,它打破了内存对GPU算力的"封印",让GPU的万亿次计算能力真正落地为实际业务效率的提升。对于AI大模型、高分辨率视觉、科学计算等前沿领域,HBM3E已不是"可选配置",而是决定GPU能否参与下一代算力竞争的"刚需门槛"


为您推荐
PRCV 2025盛大启幕,超集信息多重算力方案为CV发展护航
2025.10.24
PRCV 2025盛大启幕,超集信息多重算力方案为CV发展护航
PRCV 2025开幕在即,超集信息邀您共赴CV学术盛宴!
2025.10.11
PRCV 2025开幕在即,超集信息邀您共赴CV学术盛宴!
超集信息专业度再获认证,入选NVIDIA Quadro NPN生态
2025.09.30
超集信息专业度再获认证,入选NVIDIA Quadro NPN生态
国庆假期,服务无休,超集信息7*24小时守护您的算力征程
2025.09.26
国庆假期,服务无休,超集信息7*24小时守护您的算力征程
超集信息重磅亮相2025 青科会!硬核算力+案例实践,赋能图象图形学持续创新
2025.09.22
超集信息重磅亮相2025 青科会!硬核算力+案例实践,赋能图象图形学持续创新
AMD & 超集信息行业创新研讨会,圆满落幕!
2025.09.16
AMD & 超集信息行业创新研讨会,圆满落幕!
2025.09.09
"专业、创新、开放",超集信息闪耀数据中心&液冷峰会!
NVIDIA Jetson Thor正式发售,超集信息全面开放预订!
2025.08.27
NVIDIA Jetson Thor正式发售,超集信息全面开放预订!
超集信息国产算力平台产品,大批量上线啦!
2025.08.20
超集信息国产算力平台产品,大批量上线啦!
PlatforMax再迎重大升级,释放超算集群新效能
2025.08.15
PlatforMax再迎重大升级,释放超算集群新效能
全局规划+高度定制,
2025.08.08
全局规划+高度定制,"超集液冷"再落地,从不止是简单建设
以实践论技术!超集信息领先方案亮相液冷峰会
2025.08.01
以实践论技术!超集信息领先方案亮相液冷峰会
从算力底座到AI落地,超集信息亮相智博会,助推产业
2025.07.31
从算力底座到AI落地,超集信息亮相智博会,助推产业"智"变
超集信息液冷系列产品重磅升级,惊艳亮相WAIC 2025
2025.07.29
超集信息液冷系列产品重磅升级,惊艳亮相WAIC 2025
超集信息当选全球计算联盟理事单位,助力全球算力生态建设!
2025.07.25
超集信息当选全球计算联盟理事单位,助力全球算力生态建设!
液冷持续创新,超集信息亮相2025年亚洲数据中心峰会(香港站)
2025.07.15
液冷持续创新,超集信息亮相2025年亚洲数据中心峰会(香港站)
超集信息5大液冷方案,亮相第四届中国数据中心服务器与设备峰会
2025.07.01
超集信息5大液冷方案,亮相第四届中国数据中心服务器与设备峰会
超集信息与智诚人工智能签订战略合作协议,共创 AI产业新未来
2025.06.26
超集信息与智诚人工智能签订战略合作协议,共创 AI产业新未来
名额有限!DeepSeek一体机免费测试火热报名中
2025.03.27
名额有限!DeepSeek一体机免费测试火热报名中
图象科学创新突破,超集算力革新
2024.12.16
图象科学创新突破,超集算力革新
绿色算力新篇章,超集信息液冷产品矩阵亮相2024全球智博会
2024.12.11
绿色算力新篇章,超集信息液冷产品矩阵亮相2024全球智博会
第六届全国生物医学数据挖掘与计算学术会议圆满落幕,超集信息液冷算力方案闪耀全场!
2024.12.10
第六届全国生物医学数据挖掘与计算学术会议圆满落幕,超集信息液冷算力方案闪耀全场!
生态合作
生态合作
全面服务伙伴
电话咨询
电话咨询
7*24 小时热线服务
提交项目需求
提交项目需求
8 小时内方案呈现
服务与保修
服务与保修
4 小时内技术响应