智算融合方案_苏州超集信息科技有限公司

400-860-6560

智算融合方案
智算融合一体机解决方案
智算融合一体机基于超集信息自主研发的PlatforMax智算融合平台,为用户提供了流程可视化的管理平台。一体机整体采用分布式架构理念,为用户提供资源管理、用户管理、镜像管理、作业调度、存储管理、监控中心等功能,让资源管理更方便快捷,具备统一的资源管理、统一的监控运维、统一的开发环境、统一的作业管理等功能。 智算融合一体机可根据用户需求灵活调配,支持单机环境AI模块全流程设计,也可根据用户算力需求扩展为单柜或多柜的HPC或HPC+AI方案,适应多种用户使用场景。
方案背景
深度学习是人工智能领域的一个重要学科。从人类发明计算机开始,就一直尝试让计算机具有学习的能力,特别是从20世纪80年代以来,深度学习在算法、理论和应用等方面都获得巨大成功。2006 年以来,“深度学习”开始成为一个新的科研热点,目前已经深入到很多行业,在很多应用领域获得成功,相关的研究工作也得到了大力推广。

HPC应用往往基于第一性原理的探索,在面对大量的数据库数据和样本数据时,对于数据的处理显得有些捉襟见肘,同时对于大量的仿真结果与大量计算结果数值的分析,也需要更多的时间完成,但AI是基于大量数据结合算法诞生的技术,擅长对于大量样本数据的提取,同时对于大量仿真结果与计算结果的加速分析,用AI的方式处理HPC任务时,不仅可以有效处理样本数据,对于得到的大量计算结果,可以利用AI的迭代细化的底层模型,完成大量结果的快速分析计算,实现降本增效。同时HPC的大量结果数据又可以为AI提供原始数据,为模型的预测提供更好的支持,二者相辅相成。

大模型的诞生源于深度学习与大数据、大算力的结合。2017年Transformer架构提出后,模型规模迅速扩大。以2018年BERT、2020年GPT-3为代表,大模型展现出强大语言理解和生成能力,随着Deepseek、千问等优质大模型的发布,人工智能领域算力提升、海量互联网文本积累及自监督学习技术进步,共同推动了大模型快速发展,并广泛应用于搜索、对话、创作等领域。
应用领域
用户价值
算力灵活扩展
算力灵活扩展

一体机计算能力可根据用户需求灵活调配,可支持单机环境深度学习全流程设计或HPC单机计算,也可根据用户算力需求扩展为单柜或多柜的分布式AI、HPC、大模型任务,适应不用应用场景及用户对于计算的需求。

智能管理监控
智能管理监控

一体机可实时监控系统资源、节点状态、任务运行情况,通过图形化界面,从分区、用户、集群等各个层次和维度展示当前CPU、GPU等使用率、使用趋势、配额雷达图、任务运行概况;平台通过折线图、旭日图、直方图、分布雷达图、桑基图、气泡图等多种监控、统计方式,满足不同用户使用需求。

AI+HPC+大模型作业管理
AI+HPC+大模型作业管理

用户可以提交配置调试任务、HPC、交互式开发任务、AI任务以及快速部署GPU Stack和Dify,完成从配置、脚本、代码验证到AI、HPC、大模型的运行,同时展示AI、HPC作业、大模型的任务名称、节点、分区、项目、状态、以及对任务的操作。

高效数据存储
高效数据存储

采用软件定义存储,通过分布式存储系统构建统一存储资源池,支持块、文件、对象等多种存储协议,满足业务平台的存储需求,可实现统一管理,实现简化运维。分布式存储支持IB高速网络和RDMA,数据读写效率高。

产品特点
算力灵活扩展
算力灵活扩展

一体机计算能力可根据用户需求灵活调配,可支持单机环境深度学习全流程设计或HPC单机计算,也可根据用户算力需求扩展为单柜或多柜的分布式AI或HPC任务,适应不用应用场景及用户对于计算的需求。

智能管理监控
智能管理监控

一体机可实时监控管理集群资源使用情况和硬件状态,包括任务监控、GPU使用看板、节点健康等,并提供用户、集群、分区、节点维度的详细使用报表,大幅提高资源使用效率,用户通过远程控制台监控一体机的运行和健康状态。

AI+HPC作业管理
AI+HPC作业管理

用户可以在线提交配置调试任务、HPC、交互式开发任务、AI任务,完成从配置、脚本、代码验证到AI及HPC的运行,同时展示AI和HPC作业的任务名称、节点、分区、项目、状态、以及对任务的操作。

高效数据存储
高效数据存储

采用软件定义存储,通过分布式存储系统构建统一存储资源池,支持块、文件、对象等多种存储协议,满足业务平台的存储需求,可实现统一管理,实现简化运维。分布式存储支持IB高速网络和RDMA,数据读写效率高。

任务作业 — 智算融合平台
生态合作
生态合作
全面服务伙伴
电话咨询
电话咨询
7*24 小时热线服务
提交项目需求
提交项目需求
8 小时内方案呈现
服务与保修
服务与保修
4 小时内技术响应