什么是HGX?

HGX 是 NVIDIA 专为数据中心的高性能计算 (HPC) 和AI (AI) 工作负载而设计的平台。 HGX 并非特定产品,而是一种可扩展的硬件设计,它为构建 GPU 加速服务器和系统提供了蓝图。

 

NVIDIA HGX 的主要特性:

 

  • 模块化设计:HGX 平台采用模块化设计,允许数据中心运营商和系统集成商构建和配置满足其特定需求的服务器。

 

  • GPU 加速:专为 NVIDIA GPU 而设计,包括 Tesla 和 Ampere GPU,这些 GPU 针对 AI、机器学习、深度学习和其他计算密集型任务进行了优化。

 

  • 可扩展性:HGX 平台支持可扩展配置,使组织能够根据工作负载需求扩展或横向扩展其计算基础设施。

 

  • 互连性:支持 NVIDIA NVLink 和 PCI Express (PCIe) 等高速互连技术,从而促进 GPU 与其他组件之间的高效通信。

 

  • 兼容性:HGX 平台旨在与 NVIDIA 的软件生态系统(包括统一计算设备架构 (CUDA) 和 NVIDIA GPU 云 (NGC))协同工作,提供优化的 AI 和 HPC 软件容器。

 

NVIDIA HGX 的应用:

 

  • AI和机器学习学习:加速AI应用中深度学习模型的训练和推理任务。

 

  • 高性能计算 (HPC):在研究、学术界和工业界执行复杂的模拟、科学计算和数据分析。

 

  • 数据中心:支持部署 GPU 加速服务器,用于云计算、数据处理和企业应用。

 

NVIDIA HGX 作为一个基础平台,使数据中心能够有效地利用 NVIDIA 的 GPU 技术来执行高级计算任务,提供可扩展性、性能和灵活性,以满足现代AI和高性能计算工作负载的需求。