Redpanda Connectors 是 Redpanda 生态系统中的核心数据集成组件,旨在提供 Redpanda 与外部数据系统之间的高效数据流动能力。通过预定义的连接器(Connectors),用户可轻松实现 Redpanda 主题(Topics)与各类外部数据源/目标系统(如数据库、消息队列、存储服务、API 等)之间的双向数据同步,无需编写自定义集成代码,从而简化数据管道构建流程,加速企业级数据集成架构的落地。
支持主流数据系统协议与接口,包括但不限于:
docker run)通过 docker run 命令直接启动 Redpanda Connectors 容器,适用于快速测试或单节点部署。
步骤 1:准备配置文件
创建连接器配置文件(如 connector-config.yaml),示例如下(以 MySQL 源连接器为例):
yamlname: mysql-source-connector connector.class: io.confluent.connect.jdbc.JdbcSourceConnector connection.url: jdbc:mysql://mysql:3306/mydb?user=root&password=secret mode: incrementing incrementing.column.name: id topic.prefix: mysql- tasks.max: 1
步骤 2:启动容器
bashdocker run -d \ --name redpanda-connector \ --network redpanda-network \ # 与 Redpanda 集群同一网络 -v $(pwd)/connector-config.yaml:/etc/redpanda-connectors/config.yaml \ # 挂载配置文件 -e REDPANDA_BROKERS=redpanda-1:9092,redpanda-2:9092 \ # Redpanda brokers 地址 -e CONNECTOR_TYPE=source \ # 连接器类型:source(源)/sink(汇) -e CONFIG_FILE=/etc/redpanda-connectors/config.yaml \ # 配置文件路径 -p 8083:8083 \ # 连接器 REST API 端口(用于监控与管理) redpandadata/connectors:latest # 镜像名称(需替换为实际版本,如 v23.1.5)
通过 Docker Compose 定义多服务部署,适用于开发、测试或生产环境(含依赖组件)。
步骤 1:创建 docker-compose.yml
yamlversion: '3.8' networks: redpanda-net: driver: bridge services: # Redpanda 集群(单节点,仅用于测试) redpanda: image: redpandadata/redpanda:v23.1.5 command: redpanda start --overprovisioned --smp 1 --memory 1G --reserve-memory 512M --node-id 0 --check=false ports: - "9092:9092" # Kafka API - "9644:9644" # Admin API networks: - redpanda-net volumes: - redpanda-data:/var/lib/redpanda/data # Redpanda Connectors 服务(MySQL 源连接器示例) redpanda-connector: image: redpandadata/connectors:latest depends_on: - redpanda - mysql # 外部数据源(MySQL) environment: - REDPANDA_BROKERS=redpanda:9092 - CONNECTOR_TYPE=source - CONFIG_FILE=/etc/redpanda-connectors/config.yaml - LOG_LEVEL=info # 日志级别:debug/info/warn/error volumes: - ./connector-config.yaml:/etc/redpanda-connectors/config.yaml # 挂载本地配置文件 ports: - "8083:8083" # 连接器 REST API 端口 networks: - redpanda-net # 外部数据源示例(MySQL) mysql: image: mysql:8.0 environment: - MYSQL_ROOT_PASSWORD=secret - MYSQL_DATABASE=mydb ports: - "3306:3306" networks: - redpanda-net volumes: - mysql-data:/var/lib/mysql volumes: redpanda-data: mysql-data:
步骤 2:启动服务
bashdocker-compose up -d
Redpanda Connectors 支持通过环境变量定义全局配置,常用参数如下:
| 参数名 | 描述 | 示例值 | 是否必填 |
|---|---|---|---|
REDPANDA_BROKERS | Redpanda brokers 地址列表(逗号分隔) | redpanda-1:9092,redpanda-2:9092 | 是 |
CONNECTOR_TYPE | 连接器类型:source(源连接器,从外部系统读数据)或 sink(汇连接器,向外部系统写数据) | source | 是 |
CONNECTOR_NAME | 连接器名称(需唯一,用于标识与管理) | mysql-users-source | 是 |
CONFIG_FILE | 连接器详细配置文件路径(容器内路径) | /etc/redpanda-connectors/config.yaml | 是 |
LOG_LEVEL | 日志级别 | info(默认)/debug/warn/error | 否 |
OFFSET_STORAGE_TOPIC | 用于存储连接器偏移量的 Redpanda 主题名称(源连接器必填) | connect-offsets | 源连接器必填 |
STATUS_STORAGE_TOPIC | 用于存储连接器状态的 Redpanda 主题名称 | connect-status | 否 |
KEY_CONVERTER | 键(Key)序列化器类名(如 JSON、Avro) | org.apache.kafka.connect.json.JsonConverter | 否 |
VALUE_CONVERTER | 值(Value)序列化器类名 | org.apache.kafka.connect.json.JsonConverter | 否 |
连接器的具体行为通过配置文件(如 config.yaml)定义,不同类型连接器配置差异较大,以下为 MySQL 源连接器示例:
yaml# 连接器基础信息 name: mysql-source-connector # 需与环境变量 CONNECTOR_NAME 一致 connector.class: io.confluent.connect.jdbc.JdbcSourceConnector # 连接器实现类(需匹配连接器类型) tasks.max: 2 # 并行任务数(根据数据量调整) # 数据库连接配置 connection.url: jdbc:mysql://mysql:3306/mydb?user=root&password=secret # MySQL 连接 URL connection.user: root # 数据库用户名(也可在 URL 中指定) connection.password: secret # 数据库密码(也可在 URL 中指定) # 数据同步配置 mode: incrementing # 同步模式:incrementing(自增 ID)、timestamp(时间戳)、bulk(全量) incrementing.column.name: id # 自增列名(mode=incrementing 时必填) table.whitelist: users,orders # 同步的表名(逗号分隔,默认同步所有表) topic.prefix: mysql- # Redpanda 主题前缀(最终主题名为 ${topic.prefix}${table_name}) # 轮询配置 poll.interval.ms: 5000 # 数据轮询间隔(毫秒,默认 5000) batch.max.rows: 1000 # 每批同步最大行数(默认 1000) # 序列化配置(如不通过环境变量指定,可在此定义) key.converter: org.apache.kafka.connect.json.JsonConverter value.converter: org.apache.kafka.connect.json.JsonConverter key.converter.schemas.enable: false # 是否启用键的 Schema 信息 value.converter.schemas.enable: false # 是否启用值的 Schema 信息
bashdocker ps | grep redpanda-connector # 独立部署 # 或 docker-compose ps # Compose 部署
通过连接器 REST API 查看状态:
bashcurl http://localhost:8083/connectors/mysql-source-connector/status
预期返回 status: "RUNNING",表示连接器正常运行。
bashdocker exec -it $(docker ps -q --filter name=mysql) mysql -uroot -psecret -e "INSERT INTO mydb.users (id, name) VALUES (1, 'test');"
bash# 进入 Redpanda 容器 docker exec -it $(docker ps -q --filter name=redpanda) rpk topic consume mysql-users
预期输出包含插入的测试数据。
bashcurl http://localhost:8083/connectors
bash# 暂停 curl -X PUT http://localhost:8083/connectors/mysql-source-connector/pause # 恢复 curl -X PUT http://localhost:8083/connectors/mysql-source-connector/resume
bashcurl -X PUT -H "Content-Type: application/json" http://localhost:8083/connectors/mysql-source-connector/config \ -d '{"connector.class":"io.confluent.connect.jdbc.JdbcSourceConnector", "tasks.max":3, ...}' # 新配置
bashcurl -X DELETE http://localhost:8083/connectors/mysql-source-connector
bashdocker logs -f redpanda-connector # 独立部署 # 或 docker-compose logs -f redpanda-connector # Compose 部署
root)对文件有读权限,避免因权限不足导致配置加载失败。--network 指定),或配置端口映射与路由规则。--memory、--cpus),避免因资源不足导致同步延迟或任务失败。REDPANDA_BROKERS 指定 sasl_ssl:// 地址),并加密外部系统连接(如 MySQL SSL、S3 HTTPS)。OFFSET_STORAGE_TOPIC),以便故障恢复时快速重建连接器。来自真实用户的反馈,见证轩辕镜像的优质服务
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像加速服务
在 Docker Desktop 配置镜像加速
Docker Compose 项目配置加速
Kubernetes 集群配置 Containerd
在宝塔面板一键配置镜像加速
Synology 群晖 NAS 配置加速
飞牛 fnOS 系统配置镜像加速
极空间 NAS 系统配置加速服务
爱快 iKuai 路由系统配置加速
绿联 NAS 系统配置镜像加速
QNAP 威联通 NAS 配置加速
Podman 容器引擎配置加速
HPC 科学计算容器配置加速
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名加速
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429