适用于生成式 AI 的 ASUS L40S 服务器系统

服务器和工作站

解决方案

解决方案

利用我们的全新技术创新，部署从核心到云端的智能与连接功能。
查看所有解决方案

水冷解决方案第3代英特尔至强可扩展处理器 AMD EPYC™ 7003 处理器英特尔至强E-2300处理器混合云解决方案英特尔傲腾持久型内存

ASUS Cloud 解决方案合作伙伴

查看所有解决方案
产品

产品

使用 ASUS 服务器和工作站加速不同平台类型和规模的工作负载。
查看所有产品

服务器机架服务器 GPU 服务器直立式服务器高密度服务器服务器主板服务器配件

工作站性能主流基本

软件 ASUS Control Center ASMB

查看所有产品
新闻与活动

新闻与活动

与我们互动，浏览我们的新闻、媒体、活动和客户案例。

新闻中心

视频

活动与网络研讨会

成功案例

媒体评论
支持

支持

我们提供多种支持渠道，解决您的销售、产品和技术问题。

技术支持

操作系统兼容性指南 GPU 兼容性列表 CPU 支持列表

购买地点联络我们

产品注册保修常见问题

联络信息

ASUS RP-NVIDIAL40S 双频范围延伸设备最大可将无线涵盖范围延伸至 2200 平方英尺，为您的住家提供全方位 WiFi 服务。

加速 AI 与图形处理性能

为了利用生成式 AI 进行转型，企业需要以更大规模部署更多运算资源，而 ASUS 提供多款 NVIDIA L40S 服务器，可更快获得并使用 GPU 资源，缩短 AI 部署时间，并提供强大的运算性能与更佳的性价比。

ASUS 是 NVIDIA OVX 服务器系统的指定供货商，也是经验丰富且值得信赖的 AI 解决方案供货商，能利用其专业知识和能力消除技术鸿沟，为客户提供优化解决方案。

三大理由选择
ASUS L40S 服务器系统

更快速的部署

较短的交货期
更佳的性价比

性能比 A100 高出 2 倍
更高的性能

强大的 AI 与图形处理

NVIDI L40S 产品图片

NVIDIA L40S

NVIDIA L40S GPU 采用 Ada Lovelace 架构，是专为数据中心设计的强大通用 GPU，可为大型语言模型 (LLM) 推论和训练、图形和视频应用程序提供突破性的多重工作负载加速。

进一步了解

微调 LLM

4 小时

GPT-175B 860M Tokens
LLM 推论

1.1 倍

与 HGX A100 性能比较
AI 推论

1.5 倍

与 A100 80GM SXM2 性能比较

NVIDIA L40S 规格

	L40S	A100 80GB SXM
适合用于	生成式 AI 的通用 GPU	最高性能的多节点 AI
GPU 架构	NVIDIA Ada Lovelace	NVIDIA Ampere
FP64	不适用	9.7 TFLOPS
FP32	91.6 TFLOPS	19.5 TFLOPS
RT 核心	212 TFLOPS	不适用
TF32 Tensor 核心	366 TFLOPS	312 TFLOPS
FP16/BF16 Tensor 核心	733 TFLOPS	624 TFLOPS
FP8 Tensor 核心	1466 TFLOPS	不适用
INT8 Tensor 核心	1466 TOPS	1248 TFLOPS
GPU 内存	48 GB GDDR6	80 GB HBM2e
GPU 内存带宽	864 GB/s	2039 GB/s
L2 缓存	96 MB	40 MB
媒体引擎	3 NVENC (+AV1) 3 NVDEC 4 NVJPEG	0 NVENC 5 NVDEC 5 NVJPEG
功率	最高 350 瓦	最高 400 瓦
外型尺寸	双插槽 FHFL	8 卡 HGX
互连界面	PCle Gen4 x 16：64 GB/s	PCle Gen4 x 16：64 GB/s

NVIDIA L40S 用于大型语言模型 (LLM) 训练

微调、训练小型模型以及最高 4K GPU 中小规模训练的理想解决方案。

微调现有模型 (训练 860M Tokens 的时间)
		TE/FP8 的预期加速
	HGX A100	L40S	HGX H100
GPT-40B LoRA (8 GPU)	12 小时	1.7 倍	4.4 倍
GPT-175B LoRA (64 GPU)	6 小时	1.6 倍	4.3 倍

训练小型模型 (训练 10B Tokens 的时间)
		TE/FP8 的预期加速
	HGX A100	L40S	HGX H100
GPT-7B (8 GPU)	12 小时	1.7 倍	4.4 倍
GPT-13B (8 GPU)	6 小时	1.6 倍	4.3 倍

训练基础模型 (训练 300B Tokens 的时间)
		TE/FP8 的预期加速
	HGX A100	L40S	HGX H100
GPT-175B (256 GPU)	64 小时	1.4 倍	4.5 倍
GPT-175B (1K GPU)	16 小时	1.3 倍	4.6 倍
GPT-175B (4K GPU)	4 小时	1.2 倍	4.1 倍

适合您解决方案的产品

ESC8000-E11 产品图片

8 GPU、4U、双插槽第 4 代 Intel Xeon 可扩展 CPU

ESC4000-E11 产品图片

4 GPU、2U、双插槽第 4 代 Intel Xeon 可扩展 CPU

ESC4000-E10 产品图片

4 GPU、2U、双插槽第 3 代 Intel Xeon 可扩展 CPU

ESC8000A-E12 产品图片

8 GPU、4U、双插槽 EPYC 9004 CPU PCIe 5.0 交换器解决方案

ESC8000A-E11 产品图片

8 GPU、4U、双插槽 EPYC 7003 CPU

ESC4000A-E12 产品图片

4 GPU、2U、单插槽 EPYC 9004 CPU

ESC4000A-E11 产品图片

4 GPU、2U、单插槽 EPYC 7003 & 7002 CPU

资源

ASUS 商用主板为企业提供世界一流的服务和长期可用性

ASUS 商用主板为企业提供出色的服务和长期可用性

查看购买指南

ASUS 迷你计算机 - 强大、小巧且多功能的解决方案，适用于企业和专业人士

ASUS 迷你电脑 - 强大、小巧且多功能的解决方案，适用于企业和专业人士

查看产品特色页面

ASUS Pro B660M-C D4-CSM 评测，让企业充满乐趣

ASUS Pro B660M-C D4-CSM 评测，让企业充满乐趣

查看媒体评论

ASUS Control Center Express 简介

ASUS Control Center Express 简介

观看视频

Q670、B660 和 H610 商用主板为企业提供完整的 Intel 第12 代解决方案

Q670、B660 和 H610 商用主板为企业提供完整的 Intel 第 12 代解决方案

查看购买指南