硬件平台
xLLM 支持多种加速器后端,用于大模型推理部署。本章节汇总不同硬件平台的环境准备、运行时设备选择、服务启动和模型支持入口。
- NVIDIA GPU - CUDA 后端环境和启动入口。
- 昇腾 NPU - 昇腾 NPU 环境、运行时变量和 HCCL 启动注意事项。
- 寒武纪 MLU - MLU 后端环境和启动入口。
- 海光 DCU - 海光 DCU 后端环境和启动入口。
xLLM 支持多种加速器后端,用于大模型推理部署。本章节汇总不同硬件平台的环境准备、运行时设备选择、服务启动和模型支持入口。