SysMax
AMAX Tool是一款专为数据中心和服务器运维场景设计的综合性服务器管理工具。它将系统信息查看、日志收集、硬件测试、系统维护等多种关键功能充分整合,通过菜单驱动的交互界面和自动化脚本引擎,为管理员提供一站式、高效率的运维支持。
AMAX Tool智能化服务器运维管理平台全面覆盖从日常巡检、故障诊断到新机部署及性能测试的全生命周期管理,通过直观的菜单驱动设计降低操作门槛,使非专业管理员也能轻松驾驭复杂任务;它将传统耗时数小时的运维工作压缩至分钟级,实现整体效率提升80%以上、故障定位时间减少70%的显著突破,并自动生成详尽的检测报告与日志文件,为故障排查与审计追踪提供强有力的数据支撑。
AMAX Tool智能化服务器运维管理平台全面覆盖从日常巡检、故障诊断到新机部署及性能测试的全生命周期管理,通过直观的菜单驱动设计降低操作门槛,使非专业管理员也能轻松驾驭复杂任务;它将传统耗时数小时的运维工作压缩至分钟级,实现整体效率提升80%以上、故障定位时间减少70%的显著突破,并自动生成详尽的检测报告与日志文件,为故障排查与审计追踪提供强有力的数据支撑。

产品架构
-
核心价值快速诊断服务器故障,高效完成日常维护,缩短运维操作周期,将传统数小时的运维工作压缩至分钟级;
自动生成详尽的检测报告与日志文件,为故障排查、审计追踪提供完整的数据支撑;
广泛兼容多种主流服务器硬件与Linux发行版,适配不同架构的服务器运行环境;
减少人工干预与重复劳动,降低运维操作的出错率,提升服务器集群的稳定性与可用性;
成为数据中心运维团队的核心工具,实现服务器全生命周期的标准化、智能化管理。 -

核心功能
系统信息模块
全面查看服务器硬件与系统配置信息,支持信息导出保存,包含多个子功能,是新机上架、日常巡检的基础操作模块。
功能:全面查看并导出服务器硬件配置信息,包括CPU、内存、磁盘、RAID、GPU及网络详情。
场景:新机上架验收、资产盘点、定期信息归档。
功能:全面查看并导出服务器硬件配置信息,包括CPU、内存、磁盘、RAID、GPU及网络详情。
场景:新机上架验收、资产盘点、定期信息归档。

日志收集
一键自动收集各类服务器日志,完成打包压缩,支持远程上传至指定服务器,为故障排查提供完整日志依据
功能:自动收集并打包IPMI日志、RAID日志、GPU日志及系统内核日志,支持一键上传至远程服务器。
场景:故障发生时的快速现场信息保留、远程技术支持。
功能:自动收集并打包IPMI日志、RAID日志、GPU日志及系统内核日志,支持一键上传至远程服务器。
场景:故障发生时的快速现场信息保留、远程技术支持。

软件安装
实现常用运维软件与驱动的自动化一键安装,简化部署流程,避免人工配置错误,传统手动安装2-3小时,工具安装仅需10-20分钟。
功能:自动化安装常用软件和驱动,如NVIDIA驱动、Anaconda+ PyTorch环境、Docker(含GPU支持)及Mellanox网卡配置。
优势:将原本需2-3小时的手动部署缩短至10-20分钟,且避免配置错误。
功能:自动化安装常用软件和驱动,如NVIDIA驱动、Anaconda+ PyTorch环境、Docker(含GPU支持)及Mellanox网卡配置。
优势:将原本需2-3小时的手动部署缩短至10-20分钟,且避免配置错误。

系统维护
提供服务器系统的核心配置与维护功能,包含多个子功能,确保服务器长期稳定运行,是生产环境服务器运维的核心模块。
功能:提供关闭自动更新、锁定内核版本、配置IPMI网络/用户、检测IP冲突、更换软件源及开机脚本配置等实用工具。
场景:生产环境加固、系统初始化配置、网络问题排查。
功能:提供关闭自动更新、锁定内核版本、配置IPMI网络/用户、检测IP冲突、更换软件源及开机脚本配置等实用工具。
场景:生产环境加固、系统初始化配置、网络问题排查。

硬件测试
供全面的硬件性能测试与压力测试,采用业界标准测试工具(FIO、STREAM、gpu-burn、stress-ng),评估服务器性能与硬件稳定性。
功能:提供专业的性能基准测试和压力测试,包括磁盘I/O(FIO)、内存带宽(STREAM)、GPU压力(gpu-burn)及CPU压力测试。
场景:新服务器性能验收、超频稳定性验证、散热能力评估。
功能:提供专业的性能基准测试和压力测试,包括磁盘I/O(FIO)、内存带宽(STREAM)、GPU压力(gpu-burn)及CPU压力测试。
场景:新服务器性能验收、超频稳定性验证、散热能力评估。

磁盘检查
专注于RAID阵列与物理磁盘的健康检查,及时发现磁盘潜在故障,支持简单的自动修复,保障服务器存储系统安全。
功能:检查RAID状态、自动修复异常磁盘、进行SMART健康检测,及时发现潜在硬盘故障。
场景:定期健康巡检、预防性维护。
功能:检查RAID状态、自动修复异常磁盘、进行SMART健康检测,及时发现潜在硬盘故障。
场景:定期健康巡检、预防性维护。

环境检测
检查服务器运行环境是否满足AMAX Tool的使用要求,快速定位依赖缺失、硬件不兼容、网络异常等问题,确保工具功能完整可用。
功能:自动检测运行环境依赖(如fio,ipmitool)、Python模块、硬件识别情况及网络连接状态。
场景:工具首次安装验证、功能异常时的快速排查。
功能:自动检测运行环境依赖(如fio,ipmitool)、Python模块、硬件识别情况及网络连接状态。
场景:工具首次安装验证、功能异常时的快速排查。
