星云智能一体机融合计算、网络、存储等硬件资源与星云加速平台,整柜提供多达34U融合节点。经星云平台统一整合、调动,实现大规模分布式训练,突破网络传输的通信瓶颈,实现深度学习训练超高速网络通信,大幅加速深度学习分布式计算。

应用领域

一体机实现硬件资源按需调配,深度优化的TensorFlow等分布式框架、RoCE网络协议、GDR技术等深度融合,针对包括金融、医疗、互联网、交通、智能驾驶等众多海量数据的大规模多机AI训练场景提供大幅加速,构建全球领先AI时代高速公路系统。
金融
金融行业对数据结构化和数据存储量具有极大的需求,一体机针对这类高度复杂场景的人工智能训练需求,提供训练加速,满足数据采集和分析需求,加速金融行业决策制定。
智能驾驶
智能驾驶技术立足于超量数据处理、快速部署,一体机提供易用、先进、完整的深度学习功能与分布式策略,打破通信瓶颈,助力训练加速,使智能驾驶快速上线。

客户价值

低投入、高回报
具备高密度、高效能、低功耗、易管理的特点,深度融合星云高性能底层网络加速技术,在相同硬件配置上,可实现超过3倍以上的训练效率提升,使用户效益最大化。
算法服务
星云智能团队为行业用户提供需求分析、业务流程优化、算法模型设计等咨询服务,提供AI应用开发,并为企业⽤户提供定制化服务。
海量数据存储
单柜实现PB级存储,实现超大容量数据存储服务,为用户提供安全、弹性、高效的存储服务,冗余级数据保护、数据容灾备份保障安全存储。
全栈解决方案
为用户提供高性能、高安全、高易用、可持续扩展人工智能训练平台,实现从数据准备到模型训练、模型推理、应用落地的完整解决方案。

产品优势

强劲硬件综合性能
融合高性能计算组件、安全高效的分布式存储、可靠的管理组件于一体,辅以超高速交换网络,集极致硬件之大成,助飞规模化深度学习训练场景。
顶尖分布式学习框架
自主研发的分布式加速平台、创新性的GDR技术,可减少网络通信开销,搭配优化的TensorFlow分布式框架及高效多级通信模型等技术,极大提升深度学习模型训练效率,同时保留了TensorFlow原生态API接口,用户可快速从原有环境切换至一体机平台。
简明友好的用户界面
图形化界面纳管所有物理资源,通过一体机内置容器编排引擎可视化管理所有资源,实现资源统一调度、运维监控、在线排障、管理节点高可用,可实时查看任务运行状态和结果,支持计算资源生命周期管理。
超高速网络互联
采用高速RoCE网络互联、高性能计算及存储组件,并通过合理的端到端硬件配置方案,提高网络通信的性能。

应用平台

Clustar深度学习“加速”平台

物理组件 管理节点 AP计算节点
型号 XP-22301EN XP-22201BD
图片
描述

2U服务器,冗余电源,性能稳定,配置文件高效管理,一体机健康状态与网络流量监控,任务提交与调度,高可用。

2U2/4节点高性能服务器,每节点板载两颗9200系列处理器,先进计算内核,从容应对繁重工作负载,超大容量AEP持久化内存,大带宽。

类别

专业计算节点

存储节点

型号

XP-48201G

XP-42301ST

图片
描述

 

4U8GPU服务器,单节点可以支持8块GPU卡片, 支持多种主流计算框架与分布式学习训练,利用容器技术实现秒级部署。

分布式存储系统,支持N+M冗余模式,节点间/节点内、磁盘间/磁盘内多维度数据保护机制,支持视频加速算法,克服硬件单点故障。

网络节点

机型/数量

100GbE RoCE交换机

千兆以太网交换机

图片

描述

100GbE RoCE协议交换机完美适应Clustar优化的网络,实现低延迟,高带宽的专用网络。

采用千兆网络作为管理网络及IPMI网络。

 

成功案例

上汽集团
2018年6月29日,上汽集团宣布成立人工智能实验室,是国内车企创立的首个人工智能实验室。该实验室将以上汽云计算平台、大数据平台以及业务场景为基础,创建人工智能应用和解决方案,重点聚焦在智慧出行、智能制造、智能驾驶,为上汽“电动化、智能网联化、共享化、国际化”的战略提供技术支撑。
解决方案:
采用软硬件一体化的解决方案,缩短实施周期并降低相应优化成本;高性能RDMA技术,对框架进行深度网络优化,消除多节点间网络通信瓶颈。
客户价值:
整体项目成本降低至500万元,实际两个月交付上线;提供了底层模型训练算法优化报告及AI专家现场支持智慧出行、智能制造、智能驾驶等AI应用的落地。

腾讯云
腾讯云有着深厚的基础架构,并且有着多年对海量互联网服务的经验,不管是社交、游戏还是其他领域,都有多年的成熟产品来提供产品服务。腾讯在云端完成重要部署,为开发者及企业提供云服务、云数据、云运营等整体一站式服务方案。
解决方案:
基于腾讯云现有硬件基础设施,采用星云自主研发的Clustar加速平台,优化公有云深度学习框架训练性能,显著提升AI算力。
客户价值:
实现高密度计算性能,算力提升显著,降本增效。