跳转到内容

多模态支持

本文档主要介绍xLLM推理引擎中多模态的支持进展,包括支持模型及模态类型,以及离在线接口等。

  • Qwen2.5-VL: 包括7B/32B/72B。
  • Qwen3-VL: 包括2B/4B/8B/32B。
  • Qwen3-VL-MoE: 包括A3B/A22B。
  • MiniCPM-V-2_6: 7B。
  • 图片: 支持单图、多图的输入,以及图片+Prompt组合、纯文本Promot等输入方式。