ai/qwen3-vl Docker Image Overview | Most

ai/qwen3-vl

Qwen系列迄今最强大的视觉语言模型，全面升级文本理解生成、视觉感知推理、上下文长度、空间和视频动态理解能力，具备视觉代理、视觉编码增强、高级空间感知等核心特性。

6 收藏0 次下载

🚀专业版镜像服务，面向生产环境设计

中文简介版本下载

🚀专业版镜像服务，面向生产环境设计

Qwen3 VL

Unsloth提供的GGUF版本

!logo

Qwen3-VL——Qwen系列迄今最强大的视觉语言模型。

本代模型实现全面升级：卓越的文本理解与生成、更深入的视觉感知与推理、更长的上下文长度、增强的空间和视频动态理解能力，以及更强的智能体交互能力。

核心增强：

视觉代理：操作电脑/移动设备图形界面——识别元素、理解功能、调用工具、完成任务。
视觉编码增强：从图像/视频生成Draw.io/HTML/CSS/JS代码。
高级空间感知：判断物体位置、视角和遮挡；提供更强的2D定位，并支持3D定位以实现空间推理和具身AI。
长上下文与视频理解：原生256K上下文，可扩展至1M；处理书籍和数小时长视频，具备完整回忆和秒级索引能力。
增强多模态推理：在STEM/数学领域表现出色——支持因果分析和基于证据的逻辑答案。
升级视觉识别：更广泛、更高质量的预训练使其能够“识别万物”——名人、动漫、产品、地标、动植物等。
扩展OCR：支持32种语言（从19种扩展）：在低光、模糊和倾斜场景下表现稳健；对罕见/古文字和专业术语识别更优；改进长文档结构解析。
文本理解能力媲美纯语言模型：无缝融合文本-视觉，实现无损统一理解。

模型架构更新：

!arc

Interleaved-MRoPE：通过稳健的位置嵌入在时间、宽度和高度上实现全频率分配，增强长时视频推理能力。
DeepStack：融合多级ViT特征，捕捉细粒度细节并增强图文对齐。
文本-时间戳对齐：超越T-RoPE，实现精确的时间戳定位事件，增强视频时间建模。

本仓库为Qwen3-VL-8B-Instruct的权重仓库。

可用模型变体

模型变体	参数	量化方式	上下文窗口	显存¹	大小
`ai/qwen3-vl:8B` `ai/qwen3-vl:8B-UD-Q4_K_XL` `ai/qwen3-vl:latest`	8B	MOSTLY_Q4_K_M	262K tokens	5.91 GiB	4.79 GB
`ai/qwen3-vl:2B-BF16`	2B	MOSTLY_BF16	262K tokens	4.38 GiB	3.21 GB
`ai/qwen3-vl:2B-Q8_K_XL`	2B	MOSTLY_Q8_0	262K tokens	3.34 GiB	2.17 GB
`ai/qwen3-vl:2B-UD-Q4_K_XL`	2B	MOSTLY_Q4_K_M	262K tokens	2.22 GiB	1.05 GB
`ai/qwen3-vl:4B-Q8_K_XL`	4B	MOSTLY_Q8_0	262K tokens	6.13 GiB	4.70 GB
`ai/qwen3-vl:8B-Q8_K_XL`	8B	MOSTLY_Q8_0	262K tokens	10.36 GiB	10.08 GB
`ai/qwen3-vl:32B-Q8_K_XL`	32B	MOSTLY_Q8_0	262K tokens	37.46 GiB	36.76 GB
`ai/qwen3-vl:32B-UD-Q4_K_XL`	32B	MOSTLY_Q4_K_M	262K tokens	20.41 GiB	18.67 GB
`ai/qwen3-vl:4B-BF16`	4B	MOSTLY_BF16	262K tokens	8.92 GiB	7.49 GB
`ai/qwen3-vl:8B-BF16`	8B	MOSTLY_BF16	262K tokens	15.54 GiB	15.26 GB

¹：显存基于模型特性估算。

latest → 8B

🐳 使用Docker Model Runner运行模型

运行模型：

bash
docker model run ai/qwen3-vl

更多信息，请查看Docker Model Runner文档。

🔗 链接

Qwen3-VL
Unsloth Dynamic 2.0 GGUF
如何微调

查看更多 qwen3-vl 相关镜像 →

Qwen3是通义千问系列最新推出的大语言模型，作为新一代人工智能技术成果，它专为顶尖级代码编写、数学计算、逻辑推理及语言处理任务打造，凭借先进的算法架构与深度优化的模型性能，能够高效应对多领域复杂场景下的专业需求，为用户提供精准、智能的解决方案，展现出在技术研发与应用落地中的卓越潜力。

上次更新：未知

Qwen3-Coder是Qwen推出的新一代智能编码代理模型系列。

上次更新：未知

Qwen3 is the latest Qwen LLM, built for top-tier coding, math, reasoning, and language tasks.

上次更新：未知

ai/qwen3-embedding

Qwen3 Embedding是Qwen系列最新专有模型，专为文本嵌入和排序任务设计，支持119种语言，提供0.6B、4B、8B等多种尺寸模型，适用于文本检索、代码检索、分类、聚类、平行文本挖掘等高级任务。

上次更新：未知

qwenllm/qwen3-omni

上次更新：未知

轩辕镜像配置手册

探索更多轩辕镜像的使用方法，找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

MacOS OrbStack

MacOS OrbStack 容器配置

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别？

免费版仅支持 Docker Hub 访问，不承诺可用性和速度；专业版支持更多镜像源，保证可用性和稳定速度，提供优先客服响应。

轩辕镜像支持哪些镜像仓库？

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等；免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时，表示流量已耗尽，需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致，需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本，版本过低则升级；版本正常则验证镜像信息是否正确。

镜像拉取成功后，如何去掉轩辕镜像域名前缀？

使用 docker tag 命令为镜像打上新标签，去掉域名前缀，使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅，大镜像也能快速完成下载。"

咨询镜像拉取问题请提交工单，官方技术交流群：1072982923

轩辕镜像面向开发者与科研用户，提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库，本站不存储、不修改、不传播任何镜像内容。

咨询镜像拉取问题请提交工单，官方技术交流群：
轩辕镜像面向开发者与科研用户，提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库，本站不存储、不修改、不传播任何镜像内容。