专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

tikv/tikv-importer Docker 镜像 - 轩辕镜像

tikv-importer
tikv/tikv-importer
TiKV的导入工具,用于向分布式事务型键值数据库TiKV导入数据。
0 次下载
⏱️ 镜像拉取更稳定,部署项目不再心跳加速
中文简介版本下载
⏱️ 镜像拉取更稳定,部署项目不再心跳加速

TiKV Importer 镜像文档

镜像概述和主要用途

本镜像为分布式事务型键值数据库TiKV的专用数据导入工具,旨在提供高效、可靠的批量数据导入能力。通过该工具可将外部数据源(如CSV文件、SQL导出数据等)高效导入TiKV集群,支持大规模数据迁移与初始化,是TiKV生态中数据集成的核心组件之一。

核心功能和特性

核心功能
  • 多数据源支持:兼容CSV、TSV等结构化文本格式,以及主流数据库(如MySQL、PostgreSQL)导出的数据文件。
  • 高效批量导入:基于TiKV的批量写入接口优化,减少网络交互开销,提升导入吞吐量。
  • 事务一致性:导入过程中保证数据的事务一致性,避免部分导入导致的数据不一致问题。
  • 集群兼容性:适配TiKV v4.0及以上版本集群,支持与TiKV集群动态扩容/缩容协同工作。
关键特性
  • 并行处理:支持多线程并行导入,可通过配置调整并发度以匹配集群资源。
  • 灵活配置:提供丰富的配置选项,支持自定义导入模式(追加/覆盖)、数据映射规则及性能参数。
  • 监控集成:支持导出Prometheus监控指标,便于跟踪导入进度与性能瓶颈。
  • 容错机制:具备断点续传能力,网络中断或节点故障后可恢复导入进度。

使用场景和适用范围

典型场景
  • TiKV集群初始化:新部署TiKV集群时,批量导入初始业务数据(如历史订单、用户信息等)。
  • 跨数据库迁移:从关系型数据库(MySQL、PostgreSQL)或其他KV数据库(如Redis)迁移数据至TiKV。
  • 定期数据同步:业务系统每日/每周批量导出数据并同步至TiKV集群(如报表数据、日志归档)。
  • 大数据量加载:TB级以上数据高效导入TiKV,适用于数据仓库、时序数据存储等场景。
适用范围
  • 数据量:支持MB至PB级数据导入,建议单批次数据量不小于1GB以发挥批量导入优势。
  • 数据源:本地文件、NFS共享存储或对象存储(需通过数据卷挂载至容器)。
  • TiKV集群:需运行正常且网络可访问的TiKV集群(含PD服务)。

使用方法和配置说明

基本使用示例
1. 基础Docker Run命令
bash
docker run -d \
  --name tikv-importer \
  -v /host/data:/data  `# 挂载本地数据源目录至容器内/data` \
  -v /host/config:/config  `# 挂载配置文件目录` \
  -e TIKV_PD_ADDRESSES="pd-node1:2379,pd-node2:2379"  `# TiKV集群PD服务地址(必填)` \
  -e DATA_SOURCE_PATH="/data/input.csv"  `# 数据源文件路径(容器内路径,必填)` \
  -e IMPORT_MODE="append"  `# 导入模式:append(追加)/overwrite(覆盖),默认append` \
  -e WORKERS=4  `# 并行工作线程数,默认2` \
  tikv-importer:latest
2. 查看导入日志
bash
docker logs -f tikv-importer
环境变量配置
环境变量名说明是否必填默认值
TIKV_PD_ADDRESSESTiKV集群PD服务地址列表,多个地址用逗号分隔(如"pd1:2379,pd2:2379")是-
DATA_SOURCE_PATH数据源文件路径(容器内绝对路径,如"/data/input.csv")是-
IMPORT_MODE导入模式:append(追加数据)/overwrite(覆盖现有数据)否append
WORKERS并行导入线程数,建议设置为CPU核心数的1-2倍否2
BATCH_SIZE每批导入记录数(单位:条),调整该值可优化内存占用与吞吐量否1000
LOG_LEVEL日志级别:debug/info/warn/error否info
TIMEOUT导入超时时间(如"30m"表示30分钟),0表示无超时否"60m"
配置文件使用

对于复杂配置场景,可通过配置文件定义详细规则(优先级高于环境变量)。配置文件为TOML格式,示例如下:

toml
# /host/config/importer.toml(本地配置文件)
[pd]
addresses = ["pd-node1:2379", "pd-node2:2379"]  # TiKV PD地址列表
timeout = "10s"  # PD连接超时时间

[data_source]
path = "/data/input.csv"  # 数据源路径(容器内路径)
format = "csv"  # 数据格式:csv/tsv
delimiter = ","  # 字段分隔符(csv默认",",tsv默认"\t")
header = true  # 是否包含表头行(用于字段映射)
skip_rows = 1  # 跳过开头行数(若header=true,默认跳过1行表头)

[import]
mode = "overwrite"  # 导入模式
workers = 8  # 并行线程数
batch_size = 2000  # 每批记录数
checksum = true  # 是否校验导入数据完整性

[log]
level = "debug"  # 日志级别
file = "/var/log/importer.log"  # 日志文件路径(容器内路径,需挂载日志目录)

启动容器时挂载配置文件:

bash
docker run -d \
  --name tikv-importer \
  -v /host/data:/data \
  -v /host/config:/config \  # 本地配置目录挂载至容器/config
  -v /host/log:/var/log \  # 挂载日志目录(可选)
  tikv-importer:latest --config /config/importer.toml  `# 指定配置文件路径`
导入进度监控

通过容器日志或Prometheus指标监控导入进度:

  • 日志关键字:"import progress: X%"(显示当前导入百分比)、"import completed successfully"(导入完成)。
  • Prometheus指标:容器暴露9090端口,指标包括tikv_importer_records_total(总导入记录数)、tikv_importer_duration_seconds(导入耗时)等。

注意事项

  1. 网络连通性:确保容器与TiKV集群(含PD服务)网络互通,可通过docker exec -it tikv-importer ping pd-node1测试连通性。
  2. 数据格式校验:导入前建议校验数据源文件格式(如字段数一致、无非法字符),避免格式错误导致导入失败。
  3. 资源配置:根据数据量调整容器CPU/内存资源(建议至少2核4GB内存),避免资源不足导致OOM。
  4. 数据备份:使用overwrite模式时,建议先备份TiKV集群数据,防止误操作覆盖重要数据。
  5. 权限设置:挂载的数据卷(数据源、配置、日志目录)需赋予容器读取/写入权限(如chmod 755 /host/data)。
查看更多 tikv-importer 相关镜像 →
eclipse/steady-kb-importer logo
eclipse/steady-kb-importer
暂无描述
797 pulls
上次更新:未知
atlassian/bitbucket-pipelines-importer logo
atlassian/bitbucket-pipelines-importer
用于将其他CI/CD配置导入到Bitbucket Pipelines的工具镜像
11.3K pulls
上次更新:未知
securecodebox/persistence-elastic-dashboard-importer logo
securecodebox/persistence-elastic-dashboard-importer
暂无描述
10K+ pulls
上次更新:未知
tikv/tikv logo
tikv/tikv
分布式事务性键值数据库,包含管理客户端及导入工具。
2.2K pulls
上次更新:未知
pingcap/tikv logo
pingcap/tikv
PingCAP提供的TiKV分布式KV数据库Docker镜像,用于便捷部署和运行TiKV服务。
205M+ pulls
上次更新:未知
tikv/tikv-server logo
tikv/tikv-server
一个分布式事务性键值数据库,支持分布式环境下的事务处理与键值数据存储,提供一致性与可扩展性保障。
313 pulls
上次更新:未知

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

MacOS OrbStack

MacOS OrbStack 容器配置

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
tikv/tikv-importer
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
咨询镜像拉取问题请 提交工单,官方技术交流群:1072982923
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
咨询镜像拉取问题请提交工单,官方技术交流群:
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.