autodeployai/ai-serving Docker Image Overview

autodeployai/ai-serving

提供PMML和ONNX格式AI/ML模型服务，支持HTTP(REST API)和gRPC端点的Docker镜像

2 收藏0 次下载

🙃 代码没问题，结果发布失败在拉镜像

中文简介版本下载

🙃 代码没问题，结果发布失败在拉镜像

AI-Serving Docker镜像

镜像概述与主要用途

AI-Serving Docker镜像是用于部署AI/ML模型的轻量级容器化解决方案，专注于支持开放标准格式（PMML和ONNX）的模型服务。该镜像集成AI-Serving二进制程序，默认使用ONNXRuntime CPU后端，可通过HTTP（REST API）和gRPC两种接口提供模型推理服务，适用于快速部署标准化的机器学习模型服务。

核心功能与特性

多格式支持：兼容PMML和ONNX开放标准格式的AI/ML模型，无需自定义格式转换
双接口服务：同时提供HTTP（REST API）和gRPC端点，满足不同集成需求
轻量级设计：最小化镜像体积，仅包含AI-Serving二进制及必要依赖，降低部署资源消耗
默认CPU后端：内置ONNXRuntime CPU后端，开箱即可运行，无需额外配置
即开即用：预安装AI-Serving程序，无需手动编译，拉取镜像后可快速启动服务

使用场景与适用范围

企业级AI模型部署：需要标准化接口（REST/gRPC）对外提供模型服务的场景
多格式模型统一服务：同时管理PMML和ONNX格式模型，简化多模型部署流程
轻量级CPU环境：适用于无GPU资源的服务器或边缘设备，通过CPU高效运行模型
快速原型验证：无需复杂配置，快速将训练好的PMML/ONNX模型转换为可访问的API服务

使用方法与配置说明

基本部署命令

使用以下命令拉取并启动AI-Serving容器（默认端口需参考官方文档确认）：

bash
docker run -p 8080:8080 autodeployai/ai-serving

挂载模型目录

如需加载本地模型文件，通过-v参数挂载模型目录（假设本地模型路径/local/models，容器内路径/models）：

bash
docker run -p 8080:8080 -v /local/models:/models autodeployai/ai-serving --model-dir /models

配置参数说明

详细配置参数（如端口修改、日志级别、模型加载策略等）可通过命令行参数或配置文件指定，完整参数列表请参考官方文档：AI-Serving GitHub

访问服务

服务启动后，可通过以下方式访问：

REST API：http://localhost:8080/v1/models/{model-name}:predict
gRPC：连接localhost:8080，使用对应protobuf定义调用服务

镜像信息

官方仓库：GitHub - autodeployai/ai-serving
镜像特性：最小化镜像，包含AI-Serving二进制及默认ONNXRuntime CPU后端，支持PMML和ONNX模型服务

查看更多 ai-serving 相关镜像 →

bitnami/tensorflow-serving

Bitnami Secure Image for tensorflow-serving

35500K+ pulls

上次更新：未知

tensorflow/serving

TensorFlow Serving（[***]

14850M+ pulls

上次更新：未知

轩辕镜像配置手册

探索更多轩辕镜像的使用方法，找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

MacOS OrbStack

MacOS OrbStack 容器配置

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别？

免费版仅支持 Docker Hub 访问，不承诺可用性和速度；专业版支持更多镜像源，保证可用性和稳定速度，提供优先客服响应。

轩辕镜像支持哪些镜像仓库？

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等；免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时，表示流量已耗尽，需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致，需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本，版本过低则升级；版本正常则验证镜像信息是否正确。

镜像拉取成功后，如何去掉轩辕镜像域名前缀？

使用 docker tag 命令为镜像打上新标签，去掉域名前缀，使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"