快速开始
所有的镜像都存放在这里,下面的docker启动命令以开发镜像为例。
下面是我们构建好的开发镜像。
# A2 x86docker pull quay.io/jd_xllm/xllm-ai:xllm-dev-a2-x86-20260306# A2 armdocker pull quay.io/jd_xllm/xllm-ai:xllm-dev-a2-arm-20260306# A3 armdocker pull quay.io/jd_xllm/xllm-ai:xllm-dev-a3-arm-20260306容器启动命令如下:
docker run -it \--ipc=host \-u 0 \--name xllm-npu \--privileged \--network=host \--device=/dev/davinci0 \--device=/dev/davinci_manager \--device=/dev/devmm_svm \--device=/dev/hisi_hdc \-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \-v /usr/local/Ascend/add-ons/:/usr/local/Ascend/add-ons/ \-v /usr/local/sbin/npu-smi:/usr/local/sbin/npu-smi \-v /usr/local/sbin/:/usr/local/sbin/ \-v /var/log/npu/conf/slog/slog.conf:/var/log/npu/conf/slog/slog.conf \-v /var/log/npu/slog/:/var/log/npu/slog \-v /var/log/npu/profiling/:/var/log/npu/profiling \-v /var/log/npu/dump/:/var/log/npu/dump \-v $HOME:$HOME \-w $HOME \<docker_image_name> \/bin/bashNVIDIA GPU
Section titled “NVIDIA GPU”我们提供了NVIDIA GPU使用的Dockerfile,可以构建自定义镜像,当然也可以使用我们根据默认Dockerfile构建的开发镜像:
docker pull quay.io/jd_xllm/xllm-ai:xllm-dev-cuda-x86容器启动命令如下:
sudo docker run -it \--privileged \--shm-size '128gb' \--ipc=host \--net=host \--pid=host \--name=xllm-cuda \-v $HOME:$HOME \-w $HOME \<docker_image_name> \/bin/bash我们无法提供MLU镜像,如果您已经拥有了相应的开发镜像,那么可以根据下面的命令启动容器:
sudo docker run -it \--privileged \--shm-size '128gb' \--ipc=host \--net=host \--pid=host \--name xllm-mlu \-v $HOME:$HOME \-w $HOME \<docker_image_name> \/bin/bash编译xllm
Section titled “编译xllm”如果下载的是release镜像,即tag中带有版本号的镜像,可以跳过此步,因为release镜像自带编译好的xllm二进制文件,路径为/usr/local/bin/xllm。
下载xllm及依赖
git clone https://github.com/jd-opensource/xllmcd xllm
# 第一次需要进行pre-commit安装pip install pre-commitpre-commit install
git submodule update --init --recursive编译生成的二进制文件位于/path/to/xllm/build/xllm/core/server/xllm,在新镜像中,第一次编译xllm耗时较长,因为需要编译vcpkg中的所有依赖,但是后续编译会很快。
python setup.py build启动xllm
Section titled “启动xllm”请参考 xllm启动方式。