随着人工智能技术从深度学习到最新多模态大模型的突破,自动驾驶也正式进入以 BEV( Bird’s Eye-View )和 Transformer 为核心的新一代技术框架,感知能力和泛化能力迎来飞跃式的提升。
Nullmax 致力于打造了一套先进的平台化 BEV-AI 自动驾驶整体技术架构,涵盖车端感知、预测、规划及云端数据系统,助力满足不同客户需求,快速开发出性能拔尖、易于部署、持续升级的一体化量产方案。
BEV+Transformer 的重感知轻地图自动驾驶解决方案已成为当下主流,开启了自动驾驶行业新篇章。但要训练出高质量的BEV模型,对数据量级有十分苛刻的要求,需要进行大量的数据采集和预处理,这对于场景感知性能和效果有着至关重要的影响。
为获取更多训练样本,纽劢投入了大量路测车辆,但其后端算力已难以保障爆炸式增长,路况数据的精准标注和高效预处理,后期训练时模型精度受到影响。
结合客户实际需求,超集信息为其提供了基于 AMD Genoa 平台的 ServMAX® G448-H4 计算解决方案,完成了预处理及训练集群扩展。单机双路下 AMD Genoa 平台可达192核心,384线程,客户并行处理能力迎来大幅提升;同时凭借Zen4核心,整体性能迎来大幅提升,IPC 提高了14%,并且L2大小又增加了2倍,显著提高了频率和平均延迟,数据处理效率获得大幅提升。
凭借高密度设计,G448-H4 单机 4U 空间内可实现8张全尺寸 GPU 搭载,单机混合算力高达 5280 TFLOPs,可轻松应对模型训练场景下的各类并行计算工作负载,大幅加速了客户BEV模型的整体训练进程。
为帮助客户最大化提高资源使用效率,超集信息为集群部署了 PlatforMax 智算融合平台,能够在图形化界面下直观了解并动态调整 CPU、GPU、Memory 资源,保证任务最优分布。并且,PlatforMax 针对不同的优先级需求,能够从高到低进行任务调度,同时支持队列中任务的优先级调整和插队,满足紧急任务的使用需求,模型整体训练效率得以提升。
经过超集信息对整体计算解决方案的测试和调优,纽劢科技的预处理训练集群实现了高效扩展,数据标注和预处理效率实现了 18% 提升,模型训练效率实现了 20% 以上提升,进一步加速了其BEV模型在部署优化、超长距离感知、适配任意传感器配置等方向的优化进度。