PlatforMax 智能软件平台_智能软件平台_苏州超集信息科技有限公司

400-860-6560

智能软件平台
智能软件平台
产品中心 智能软件平台 PlatforMax 智能软件平台
PlatforMax 智能软件平台
PlatforMax智算融合平台是超集信息自主研发的面向于高性能计算(HPC)和人工智能(AI)场景的智算融合平台,采用先进的技术架构,由同一个管理节点纳管,可以将计算节点资源划分为HPC和AI两个分区,分区资源相互独立,满足用户对于HPC及AI业务的资源需求,为用户提供了一套既可以进行HPC作业,又可以进行AI训练的环境,助力HPC+AI业务的发展。
PlatforMax 智能软件平台
产品架构
  • 基础层
    基础设施以硬件服务器为载体,支持主流 X86 服务器,配置 NVIDIA GPU 实现高性能加速计算,采用主流分布式存储设备,支持 TCP/IP,InfiniBand 高速网络互联。
  • 平台层
    平台层是整个系统的核心内容,采用先进的技术架构,能够实现异构资源的高效管理、调度和监控,除提供AI模型开发、AI模型训练到AI部署的完整功能外,也适用于生命科学、气象预报、量子力学、油气勘探等HPC科学计算领域。

PlatforMax 智能软件平台

核心功能
集群管理
提供集群资源监控、集群节点管理、集群分区管理、用户权限管理、数据存储、任务镜像等管理服务,对集群内资源进行HPC分区节点、AI分区节点的管理,采用表盘式工作界面,菜单界面平滑直观,功能化繁为简,一目了然。

用户管理
管理员对用户和用户组的CPU、GPU、内存和存储配额进行设定,限定资源数量。系统具备集群管理员、分区管理员、项目管理员、普通用户多级多角色管理,用户的数据存储空间相互隔离,无法越界访问未授权的数据,支持设置用户有效期,以及批量导入用户。

镜像管理
平台内置Tensorflow、PyTorch、MxNet、CUDA、Gromacs、NAMD、LAMPPS、OpenVINO、oneAPI等镜像,还可连接NGC、Docker HUB等获取镜像,支持用户上传镜像与自定义镜像,满足不同用户对镜像制作的要求。

数据存储
平台通过NFS实现统一的网络文件存储系统,支持多种单机,分布式等多种存储方式,支持数据上传、下载、删除、压缩、解压、复制、移动和内容浏览等,不同用户的私有数据相互隔离,用户不同的项目数据之间相互隔离。

作业调度
平台支持AI或HPC任务,AI任务可选单机或分布式任务,分布式任务支持容器之间SR-IOV高速虚拟网卡通信;HPC任务支持Web、Shell、命令行等方式提交任务,Slurm调度器根据资源需求,调度任务到最优节点,保障任务高效运行。

监控中心
监控系统资源使用情况,节点状态,任务运行情况,通过单一界面管理平台,从分区、用户、集群、任务类型等各个层次和维度展示当前GPU的空闲和占用状态,支持按种类查看GPU卡的使用,监控报表可选择AI或HPC生成所选时间的监控表报。

生态合作
生态合作
全面服务伙伴
电话咨询
电话咨询
7*24 小时热线服务
提交项目需求
提交项目需求
8 小时内方案呈现
服务与保修
服务与保修
4 小时内技术响应