跳转到内容
xLLM
开始使用
用户指南
开发者指南
CLI 参考
搜索
Ctrl
K
取消
GitHub
中
EN
中
主页
开始使用
快速开始
启动xllm
多机部署
在线服务
离线推理
模型支持列表
用户指南
热门模型使用
GLM5-W8A8
Kimi-K2.5 / Kimi-K2.6
MiniMax-M2.7
高级功能
异步调度
多流并行
ChunkedPrefill调度器
Zero Evict调度器
PD分离
Prefix Cache 优化
全局多级KV Cache
多模态支持
EP并行
MoE负载均衡(EPLB)
MTP投机推理
Graph Mode
xLLM Service
开发者指南
开发
代码结构
xLLM Ascend TileLang Kernel 开发指南
设计文档
Graph Mode 设计文档
生成式推荐设计文档
CLI 参考
GitHub
选择语言
EN
中
多模态支持
Copy page
本文档主要介绍xLLM推理引擎中多模态的支持进展,包括支持模型及模态类型,以及离在线接口等。
支持模型
Section titled “支持模型”
Qwen2.5-VL: 包括7B/32B/72B。
Qwen3-VL: 包括2B/4B/8B/32B。
Qwen3-VL-MoE: 包括A3B/A22B。
MiniCPM-V-2_6: 7B。
模态类型
Section titled “模态类型”
图片: 支持单图、多图的输入,以及图片+Prompt组合、纯文本Promot等输入方式。