|
高性能运算
打造强大的算力中心
项目背景为了推动 AI 革命的突破性发展,Foxlink Group 与 Ubitus 携手合作,带领其子公司 Shinfox Energy 共同创立了一家新公司——Ubilink。他们共同打造了强大的算力中心,其出色的整体计算性能达到 45.82 PFLOPS,超越了 NVIDIA 预估的 40 PFLOPS 理论值。[1] 在 2024 年 11 月公布的 全球超级计算机 TOP500 榜单中,它位列第 31 名,并在 Green500 榜单中荣获第 44 名的佳绩。该超算中心将提供公有云服务、AI 算力租赁以及基于订阅的云服务,包括用于训练大型语言模型的平台即服务(PaaS)和软件即服务(SaaS)。这座新数据中心的另一大亮点在于,它赋予了客户自由选择完全采用可再生能源(绿电)套餐的权利。
面临的挑战从零开始构建如此庞大且高性能的基础设施带来了巨大的挑战。确保这座 AI 超算中心的无缝运营和维护绝非易事。任何不稳定因素都可能导致频繁的运行中断,从而推高运营成本并影响整体效率。
我们的解决方案华硕全力支持 Ubilink 从零开始建设 AI 算力中心。该中心配备了 128 台 NVIDIA® H100 服务器,搭载 1,024 张 GPU 计算卡,使其成为采用绿电驱动的 AI 算力服务中心。令人瞩目的是,这个宏伟的项目仅用时三个月便顺利完工。
基础设施安装: 华硕以专业技术全程管理超算基础设施的建设,包括数据中心的落成、机柜安装、严格的测试以及交付启用。每一个阶段都经过精心执行,以确保实现最佳性能。
散热与功耗管理: 管理数以千计的 GPU 绝非易事,华硕对液冷系统进行了专门优化,以确保功耗达到行业标准的验收水平。
自动检测与恢复工具: 鉴于此类大规模 GPU 集群的复杂性和潜在故障场景,传统的 CPU 集群根本无法与之相提并论。华硕部署了先进的自动化检测和恢复工具,最大程度地降低了硬件故障带来的影响,确保将停机时间降至更低并维持更高的系统可靠性
软件平台与服务:华硕提供了一个集成的开发平台和软件栈,简化了 AI 应用程序的快速部署与优化流程,使用户能比以往任何时候都更容易地充分发挥该中心的强大潜能。
为什么选择华硕?
华硕作为硬件供应商,确保了我们能够交付快速、高品质的设备,并辅以专业的技术团队支持。这使我们成为 Ubilink 实现超算雄心的坚实后盾。
华硕 AI 服务器以其强大的算力和稳定性而闻名,结合我们集成的开发平台,已赢得广泛的赞誉。我们助力客户快速部署和优化 AI 应用程序,推动创新与效率提升,为全面迎接 AI 时代做好准备。
了解华硕如何提升数据中心的计算效率: 华硕 HGX H100 AI 服务器实现 1.23 倍性能效率提升 | 华硕服务器
推荐的型号:
[1] 数据源于 2023 年 6 月峰会的 NVIDIA DGX 测试结果,其中 NVIDIA DGX H100(128 台集群)实现了 40.66 PFLOPS 的性能,可作为本案例的基准参考。 |