面向企业/CSP 繁重AI工作负载的新一代 8-GPU 服务器

NVIDIA HGX™ B300 8-GPU 服务器

ASUS XA NB3I-E12 配备 NVIDIA Blackwell HGX B300 8-GPU 和双路英特尔® 至强® 6 可扩展处理器,专为繁重的 AI 工作负载而设计,GPU 上配备 8 个嵌入式 CX8 InfiniBand、5 个扩展 PCIe 插槽、32 个 DIMM、10 个 NVMe 和双 10Gb LAN。它能将数据转化为智能,实现高效的现实世界自动化,是运行大型语言模型(LLM)的大型企业和云服务提供商、执行科学计算的研究机构和大学以及专注于AI模型训练和推理的金融和汽车行业的理想选择。

端到端加速计算平台

NVIDIA HGX B300 整合 NVIDIA Blackwell Ultra GPU 与高速互连,推动数据中心进入加速计算和生成式人工智能的新时代。作为加速扩展平台,基于 NVIDIA Blackwell HGX 系统专为要求苛刻的生成式AI、数据分析和 HPC 工作负载而设计。
相较于 NVIDIA GPU 平台模型训练速度的柱状图。HGX H100 基准,HGX B200 较高,HGX B300 最高,这表明使用 HGX B300 进行AI训练的速度可提高至 1.7 倍。
相较于 NVIDIA GPU 平台实时吞吐量性能的条形图。HGX H100 基准、HGX B200 较高、HGX B300 最高,显示AI推理性能显著提高。
HGX B300 提供下一代AI性能,在 Llama 3.1 405B 等模型上的推理性能比上一代 NVIDIA Hopper™ 提高至 11 倍。由第二代 Transformer Engine 提供动力支持,采用定制 Blackwell Tensor Core 技术和 TensorRT™-LLM 优化技术,可加快大型语言模型的推理速度,同时通过 8 位浮点(FP8)和新精度,实现高达 4 倍的训练速度。
第五代 NVLink 及 1.8TB/s GPU-to-GPU 互连、InfiniBand 网络和 NVIDIA Magnum IO™ 软件进一步得以强化,确保企业和大规模 GPU 计算集群的高效可扩展性。
ASUS HGX B300 8-GPU 服务器的 3D 系统布局图。标签标明 NVIDIA Blackwell Ultra B200 GPU、双 Intel Xeon Scalable 处理器、最高 4TB DDR5 DIMM 内存、5 个 PCIe Gen 5 x16 扩展插槽、最多 9 个 2.5 英寸 NVMe/SATA 硬盘和 3200W 80 Plus Titanium 冗余电源。 ASUS HGX B300 8-GPU 服务器的 3D 系统布局图。标签标明 NVIDIA Blackwell Ultra B200 GPU、双 Intel Xeon Scalable 处理器、最高 4TB DDR5 DIMM 内存、5 个 PCIe Gen 5 x16 扩展插槽、最多 9 个 2.5 英寸 NVMe/SATA 硬盘和 3200W 80 Plus Titanium 冗余电源。

GPU
HGX BLACKWELL ULTRA B300

处理器
2 × 第 6 代 Intel® Xeon® 可扩展处理器 (SP) TDP 350W

内存
32 × 6400 DDR5 DIMM 插槽(最大 4TB)

扩展
5 × Gen5 PCIe 插槽(4 × 16 + 1 × 8)

存储
10 × 2.5 英寸托架(10 × NVMe)

电源5+5 冗余 3200W 80 PLUS 钛金级电源

服务器后面板视图,显示 15 个 GPU 风扇(54V,8080)和 10 个电源(54V,3200W)。 服务器后面板视图,显示 15 个 GPU 风扇(54V,8080)和 10 个电源(54V,3200W)。

GPU 风扇 x15(54V,8080)

电源 x10(54V,3200W)

服务器系统的前面板布局,显示标记的组件,包括 OCP 连接器、RAID 端口、多个 PCIe 插槽、存储托架(12 x 3.5 服务器系统的前面板布局,显示标记的组件,包括 OCP 连接器、RAID 端口、多个 PCIe 插槽、存储托架(12 x 3.5

HGX B300

OSFP 连接器 x8

RAID (X8)

PCIe 插槽(x16)

BlueField-3

存储 U.2 x10

FPB

IO 面板

配备内存通道、PCIe 切换、GPU 连接和 NVLink 桥接器的双 CPU 服务器架构框图。它说明了 CPU 互连、DIMM 内存插槽、GPU 子系统和存储接口。

模块化设计,减少线材使用

轻松排除故障,并达到导热优化

模块化设计大大减少了线材使用,可缩短系统组装时间、减少整线需求,并降低气流阻塞风险,达到导热优化。板对板连接进一步降低电缆损耗和延迟,使维护工作更加轻松,并确保了高可用性。

NVIDIA 先进技术

NVIDIA GPU、DPU、NVLink、NVSwitch 和网络的性能

XA NB3I-E12 通过集成第四代 NVLink 和 NVSwitch 技术以及 NVIDIA ConnectX-8 SmartNIC,加速AI和数据科学的发展。此外,还支持 GPUDirect® RDMA、使用 NVIDIA Magnum IO 存储空间以及 NVIDIA AI 平台的软件层的 NVIDIA AI Enterprise。
比较基于 PCIe 切换和基于 NVSwitch 服务器设计的拓扑图。HGX B200 架构使用 NVSwitch 实现完整的 GPU 到 GPU 带宽,减少延迟瓶颈。

优化的散热设计

双层 GPU 和 CPU 板,提高散热效率

XA NB3I-E12 采用流线型设计,配备专用 CPU 和 GPU 气流通道,可有效散热。两级 GPU 和 CPU 滑块设计可将热量排到周围环境空气中,提高散热效率、可扩展性和整体性能,实现更高的能效和整体系统节能。
这是服务器布局图,说明了华硕 HGX B300 系统的优化散热设计。左图显示的是将 GPU 和 CPU 分为两层进行散热的滑块。
这是服务器布局图,说明了华硕 HGX B300 系统的优化散热设计。右图显示的是安装了 GPU 的完整服务器机箱,其设计旨在提高能效和节省系统功耗。

5+5 电源

出色的能效

为降低运行成本,XA NB3I-E12 提供高效的散热和创新组件。5+5 80 PLUS Titanium 电源可实现更好的电源效率,提供可靠而充足的电力。
服务器内配有 5+5 冗余电源模块,确保高效率和故障转移能力。

可维护性

提高 IT 运营效率

  • 人体工学把手设计

  • 免工具手旋螺丝

  • Riser 转接卡固定扣

  • 免工具外壳

BMC

远程服务器管理

ASUS ASMB11-iKVM 是 ASUS 服务器管理解决方案,采用 ASPEED 2600 芯片组并执行于 AMI MegaRAC SP-X。此模块提供多种界面,可通过 WebGUI、智能平台管理界面 (IPMI) 及 Redfish® API 执行频外服务器管理。
了解更多
比较 BMC 启动时间的柱形图:AST2600 为 12.885 秒,而 AST2500 为 21.262 秒,表明

IT 基础设施管理软件

通过单一仪表板简化 IT 营运

ASUS Control Center (ACC) 是一款远程 IT 管理软件,用于监控您的硬件和软件 IT 资产和库存状态,实现无缝的远程 BIOS 设定和更新、高效的 IT 诊断和故障排除,以及通过 Hotfix 更新强化安全性,让任何人都能更轻松管理服务器 IT 基础设施。
了解更多
IT 基础设施管理软件仪表板,显示性能、警报和资源指标。

硬件信任根解决方案

侦测、复原、启动和保护

ASUS 服务器整合 PFR FPGA 做为平台信任根解决方案,可提供固件弹性以防止黑客取得基础设施的存取权。ASUS 安全解决方案完全符合 2018 年 NIST SP 800 193 规范。

* 平台固件保护恢复 (PFR) 模块必须在订购时指定并在原厂安装,并无单独出售。不单独出售。

可信平台模块(TPM)2.0

华硕服务器还支持信任平台模块 2.0 (TPM 2.0),可通过整合的加密密钥确保硬件安全,并定期更新固件以修补安全漏洞。
了解产品支持列表
英特尔至强处理器徽标

英特尔至强 6 处理器

英特尔至强 6 处理器代表性能和效率的一次重大飞跃,专为满足先进的 AI、网络和数据中心工作负载的需求而设计。这些处理器采用全 P 核架构,具有超强的计算能力,使企业能够轻松应对要求苛刻的应用。英特尔至强 6 处理器支持高速 DDR5 内存和 PCIe 5.0 I/O,确保无缝扩展性和更高的数据吞吐量,是现代高性能环境的理想之选。此外,优化的能效和强大的设计满足下一代数据中心需求,强化英特尔在AI和网络解决方案领域的地位。
  • XA NB3I-E12 适合哪些工作负载?
    XA NB3I-E12 适合哪些工作负载?XA NB3I-E12 配备 NVIDIA Blackwell HGX B300 8-GPU 和双 Intel Xeon 6 处理器,通过 8 个嵌入式 CX8 InfiniBand 实现超低延迟,可处理 LLM、AI 训练和科学计算。