全新至强6平台系统,五大优势助力AI再突破!
2025.10.17
为AI系统选择更理想的CPU,有助于优化整体性能和利用率,提升训练和推理工作负载的有效工作时长。超集信息基于英特尔® 至强® 6处理器,打造了先进的AI加速系统——ServMAX® G242-6S。
G242-6S拥有更强大的协同计算、输入/输出 (I/O) 流量管理,以及稳定的高吞吐量运行能力,并强势构建五大核心优势,能够更高效应对严苛的AI工作负载。

01
单线程性能升级
在AI加速平台中,一张GPU至少需要8-12颗高频CPU内核负责数据搬运与任务编排,否则GPU将长时间处于"空转"等待状态。G242-6S可配载全新的英特尔®至强®6性能核处理器,核心数量较上一代提升最高达2倍,为每张GPU配备充足且恰到好处的CPU"搬运工"。
更关键的是,至强6引入英特尔® Priority Core Turbo(PCT)技术:可动态挑选8颗高优先级核心,以更高频率运行,专门负责模型参数和权重的内存搬运,显著缩短GPU空闲周期;其余核心则以基频运行,承担数据预处理、I/O编排等并行任务,整机TDP更优,散热压力更小。
通过"数量足+频率优"的黄金搭配,G242-6S的GPU持续处于满血运行状态,模型训练迭代时间明显缩短,同时优化了顺序/串行处理负载的延迟表现,全面提升AI加速系统的利用率与能效比。
02
更高内存容量和带宽
训练大型生成式 AI (GenAI) 模型需要更大的内存容量来存储模型参数和权重,然后将模型传至GPU。根据通用准则,此类AI加速系统的CPU内存容量至少应为GPU内存的 2 倍。英特尔® 至强® 6处理器每通道2个 DIMM (2DPC) 的配置,使G242-6S的最大内存容量扩展至4TB,支持训练大模型所需的更大系统内存容量,并实现更优的内存性能和总体拥有成本 (TCO)。
此外,G242-6S还支持MRDIMM (Multiplexed Rank DIMM),与第五代英特尔® 至强® 平台相比,内存带宽提升高达2.3倍。这项创新的内存技术能够提升带宽和性能,同时降低内存敏感型AI负载和其他高密度数值及仿真任务的时延。
更高的内存带宽对GPU大规模推理至关重要,尤其是当推理过程中上下文长度增加导致KV Cache容量增长时,需要较高的内存带宽来支持。更高的内存带宽对新兴的代理式AI推理应用同样重要,在这类应用中CPU会负责整体任务编排。
03
AMX指令集内置
将数据加载至AI加速器时,可能产生GPU利用率瓶颈问题,因为GPU在等待数据加载时会处于闲置状态。采用向量数据库则能提升数据加载速度,提高GPU整体使用率。英特尔® 至强® 6处理器内置有英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX),该指令集除能直接加速 AI 推理任务外,也可用于加速向量数据库。
英特尔® AMX可提供更均衡的AI算力,使G242-6S能够胜任多样化任务,提供更出色的系统性能和能效表现。
04
全闪存协同
G242-6S搭载12个全闪存盘位,访问延迟从机械硬盘的毫秒级降至微秒级,提交订单、查询记录等场景的响应时间几乎为零;单盘7GB/s的读取速度远超机械硬盘,科学计算中TB级数据集加载时间从小时级缩短到分钟级;更高的IOPS能够处理海量的随机读写请求,轻松实现每秒数百万次的库存查询和更新。
同时,全闪存+至强6的能效核(E-core),开创了全新的"能效革命"。至强6的能效核在Scale-out场景下性能功耗比极佳;全闪存无机械部件,功耗远低于同等性能的硬盘阵列,且散热需求更低。二者搭配下,CPU因等待时间减少,可更快进入低功耗状态;全闪存低功耗特性与CPU能效设计协同,整机功耗可降低15%-30%。
05
更优的RAS支持
正常运行时间是系统优化的关键。英特尔提供更为先进的可靠性、可用性和可维护性 (RAS) 支持。通过更强的监测和控制能力,G242-6S系统能够以更高性能运行,并减少系统停机时间,从而避免高额损失。RAS 技术支持多项先进的管理功能,包括遥测、平台监控、共享资源控制和实时固件更新等。




声明
我方重申:所有转载的文章、图片、音频视频文件等资料知识产权归权利人所有。但因技术能力有限,无法查得知识产权来源而无法直接与版权人联系授权事宜,若转载内容可能存在引用不当或版权争议,请相关权利方及时通知我们,以便我方迅速删除相关图文内容,避免给双方造成不必要损失。