专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

target/pod-reaper Docker 镜像 - 轩辕镜像

pod-reaper
target/pod-reaper
自动构建
基于规则的Kubernetes控制器,用于终止Pod。
1 收藏0 次下载
🚀 稳定镜像源 = 更少宕机 + 更低运维成本
中文简介版本下载
🚀 稳定镜像源 = 更少宕机 + 更低运维成本

pod-reaper: 基于规则的Kubernetes Pod删除工具

![release]([] ![docker]([]

镜像概述和主要用途

pod-reaper是一个基于规则的Kubernetes Pod删除工具,旨在根据预定义条件识别并删除满足条件的Pod。通过配置不同规则,可实现混沌测试、异常Pod清理、定时维护等场景。具体规则详见「核心规则说明」部分。

核心功能和特性

  • 多规则支持:基于混沌概率、容器状态、Pod状态、运行时长等多种条件删除Pod
  • 灵活的作用域控制:支持按命名空间、标签、注解筛选目标Pod
  • 安全删除机制:可配置优雅关闭周期,支持驱逐(Eviction)操作以尊重PodDisruptionBudget
  • 可定制调度:支持Cron表达式或固定间隔调度检查周期
  • 完善的日志系统:JSON结构化日志,支持多格式(Logrus、Fluentd)和日志级别控制
  • 自愈与一次性运行:支持长期运行(通过Deployment管理)或限时运行模式

使用场景和适用范围

  • 混沌工程:通过随机概率规则(Chaos Chance)注入故障,测试系统弹性
  • 异常Pod清理:自动删除处于错误状态(如ImagePullBackOff、Evicted)的Pod
  • 资源回收:清理长时间运行或未就绪的Pod,释放集群资源
  • 维护自动化:配合调度规则实现定时Pod替换,确保应用滚动更新
  • 集群稳定性:排除特定标签的关键Pod,只清理非核心工作负载

详细配置说明

环境变量总览

pod-reaper通过环境变量配置,需至少启用一个规则(详见「核心规则说明」),否则将报错退出。主要环境变量分类如下:

类别环境变量列表
基础配置NAMESPACE、GRACE_PERIOD、SCHEDULE、RUN_DURATION、EVICT、DRY_RUN
标签/注解筛选EXCLUDE_LABEL_KEY、EXCLUDE_LABEL_VALUES、REQUIRE_LABEL_KEY、REQUIRE_LABEL_VALUES、REQUIRE_ANNOTATION_KEY、REQUIRE_ANNOTATION_VALUES
日志配置LOG_LEVEL、LOG_FORMAT
规则配置CHAOS_CHANCE、CONTAINER_STATUSES、POD_STATUSES、MAX_DURATION、MAX_UNREADY

示例配置:

sh
# 基础配置
NAMESPACE=test
SCHEDULE=@every 30s
RUN_DURATION=15m
EXCLUDE_LABEL_KEY=pod-reaper
EXCLUDE_LABEL_VALUES=disabled,false
DRY_RUN=false

# 启用规则(至少一个)
CHAOS_CHANCE=.001  # 混沌概率规则
基础配置参数
NAMESPACE
  • 默认值:""(监控所有命名空间)
  • 作用:指定pod-reaper监控的Kubernetes命名空间。
  • 说明:依赖Kubernetes服务账户(InClusterConfig)权限,仅能访问服务账户有权限的命名空间和Pod。
GRACE_PERIOD
  • 默认值:nil(使用Pod默认优雅关闭周期)
  • 作用:控制Pod软终止(SIGTERM)到硬终止(SIGKILL)的等待时间。
  • 格式:Go语言time.Duration格式(如"1h15m30s"),0s表示立即硬终止。
SCHEDULE
  • 默认值:"@every 1m"(每分钟检查一次)
  • 作用:配置Pod检查周期。
  • 格式:支持Cron表达式(如"* * * * *",可选秒级精度"* * * * * *")或间隔格式(如"@every 30s")。
  • 示例:"@every 1h2m3s"(每1小时2分3秒)、"12 * * * * *"(每分钟第12秒执行)。
RUN_DURATION
  • 默认值:"0s"(无限期运行)
  • 作用:指定pod-reaper运行时长,到期后立即退出(退出码0)。
  • 格式:Go语言time.Duration格式(如"15m"表示15分钟)。
  • 注意:
    • 若通过Deployment管理,退出后会被重新调度;
    • 需排除自身Pod(通过EXCLUDE_LABEL)避免自我删除导致运行时长不足。
EVICT
  • 默认值:未设置(使用删除操作)
  • 作用:启用时使用Kubernetes驱逐API(Eviction API)而非直接删除Pod。
  • 说明:尊重PodDisruptionBudget(PDB),若因PDB无法驱逐,将记录警告日志。
DRY_RUN
  • 默认值:未设置(等效于false)
  • 作用:启用时仅标记符合条件的Pod,不实际删除。
  • 有效值:1/t/T/TRUE/true/True(启用);0/f/F/FALSE/false/False(禁用)。
标签/注解筛选参数
EXCLUDE_LABEL_KEY 和 EXCLUDE_LABEL_VALUES
  • 作用:排除带有特定标签的Pod。
  • 说明:需同时设置Key和Values(逗号分隔,无空格)。若Pod标签的Key匹配EXCLUDE_LABEL_KEY且Value在EXCLUDE_LABEL_VALUES列表中,则被排除。
  • 示例:EXCLUDE_LABEL_KEY=pod-reaper、EXCLUDE_LABEL_VALUES=disabled,false → 排除标签pod-reaper: disabled或pod-reaper: false的Pod。
REQUIRE_LABEL_KEY 和 REQUIRE_LABEL_VALUES
  • 作用:仅处理带有特定标签的Pod。
  • 说明:需同时设置Key和Values(逗号分隔)。仅当Pod标签的Key匹配REQUIRE_LABEL_KEY且Value在REQUIRE_LABEL_VALUES列表中,才会被考虑。
REQUIRE_ANNOTATION_KEY 和 REQUIRE_ANNOTATION_VALUES
  • 作用:仅处理带有特定注解的Pod。
  • 说明:逻辑同REQUIRE_LABEL,但基于Pod注解。
日志配置参数
LOG_LEVEL
  • 默认值:Info
  • 作用:控制日志级别,仅输出指定级别及以上的日志。
  • 可选值:Debug、Info、Warning、Error、Fatal、Panic。
LOG_FORMAT
  • 默认值:Logrus
  • 作用:指定结构化日志格式。
  • 可选值:
    • Logrus:默认格式;
    • Fluentd:适配Fluentd/Stackdriver的格式。
日志示例
json
{"level":"info","msg":"loaded rule: chaos chance .3","time":"2017-10-18T17:09:25Z"}
{"level":"info","msg":"executing reap cycle","time":"2017-10-18T17:09:55Z"}
{"level":"info","msg":"reaping pod","pod":"hello-cloud-deployment-3026746346-bj65k","reasons":["was flagged for chaos","has been running for 3m6.257891269s"],"time":"2017-10-18T17:09:55Z"}

核心规则说明

Chaos Chance(混沌概率规则)
  • 作用:基于随机概率标记Pod进行删除。
  • 启用方式:设置CHAOS_CHANCE为浮点值(范围[0,1))。生成随机数若小于该值,则标记Pod。
  • 示例:
    sh
    SCHEDULE=@every 30s  # 每30秒检查一次
    CHAOS_CHANCE=.01      # 1%概率删除匹配的Pod
    
  • 说明:可通过EXCLUDE_LABEL排除关键Pod。
Container Status(容器状态规则)
  • 作用:删除包含特定状态容器的Pod。
  • 启用方式:设置CONTAINER_STATUSES为逗号分隔的容器状态列表(无空格)。若容器处于Waiting或Terminated状态且状态匹配,则标记Pod。
  • 示例:
    sh
    SCHEDULE=@every 10m  # 每10分钟检查一次
    CONTAINER_STATUSES=ImagePullBackOff,ErrImagePull,Error  # 匹配这些容器状态
    
  • 注意:不匹配Pod级状态(如Evicted)。
Pod Status(Pod状态规则)
  • 作用:根据Pod整体状态删除Pod。
  • 启用方式:设置POD_STATUSES为逗号分隔的Pod状态列表(无空格)。若Pod状态匹配,则标记删除。
  • 示例:
    sh
    SCHEDULE=@every 10m  # 每10分钟检查一次
    POD_STATUSES=Evicted,Unknown  # 匹配这些Pod状态
    
Duration(运行时长规则)
  • 作用:删除运行超过指定时长的Pod。
  • 启用方式:设置MAX_DURATION为Go语言time.Duration格式。若Pod运行时间超过该值,则标记删除。
  • 示例:
    sh
    SCHEDULE=@every 5m   # 每5分钟检查一次
    MAX_DURATION=2h      # 删除运行超过2小时的Pod
    
Unready(未就绪时长规则)
  • 作用:删除未就绪超过指定时长的Pod。
  • 启用方式:设置MAX_UNREADY为Go语言time.Duration格式。若Pod未就绪时间超过该值,则标记删除。
  • 示例:
    sh
    SCHEDULE=@every 5m   # 每5分钟检查一次
    MAX_UNREADY=10m      # 删除未就绪超过10分钟的Pod
    

部署与使用指南

服务账户权限

pod-reaper依赖Kubernetes服务账户权限,需配置RBAC以允许列出和删除Pod(或使用驱逐API)。

命名空间级权限示例
yaml
apiVersion: v1
kind: ServiceAccount
metadata:
  name: pod-reaper
  namespace: default
---
apiVersion: rbac.authorization.k8s.io/v1
kind: Role
metadata:
  name: pod-reaper-role
  namespace: default
rules:
- apiGroups: [""]
  resources: ["pods"]
  verbs: ["get", "list", "delete"]  # 若启用EVICT,需添加"create"(用于创建Eviction)
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: pod-reaper-binding
  namespace: default
subjects:
- kind: ServiceAccount
  name: pod-reaper
  namespace: default
roleRef:
  kind: Role
  name: pod-reaper-role
  apiGroup: rbac.authorization.k8s.io
Kubernetes部署示例
长期运行(Deployment)
yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: pod-reaper
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: pod-reaper
  template:
    metadata:
      labels:
        app: pod-reaper
        pod-reaper: disabled  # 排除自身被删除
    spec:
      serviceAccountName: pod-reaper
      containers:
      - name: pod-reaper
        image: target/pod-reaper:latest
        env:
        - name: NAMESPACE
          value: "default"
        - name: SCHEDULE
          value: "@every 1m"
        - name: EXCLUDE_LABEL_KEY
          value: "pod-reaper"
        - name: EXCLUDE_LABEL_VALUES
          value: "disabled"
        - name: CHAOS_CHANCE
          value: ".005"  # 0.5%混沌概率
一次性运行(Pod)
yaml
apiVersion: v1
kind: Pod
metadata:
  name: pod-reaper-once
  labels:
    pod-reaper: disabled  # 排除自身
spec:
  serviceAccountName: pod-reaper
  restartPolicy: Never  # 一次性运行
  containers:
  - name: pod-reaper
    image: target/pod-reaper:latest
    env:
    - name: SCHEDULE
      value: "@every 30s"  # 每30秒检查一次
    - name: RUN_DURATION
      value: "15m"        # 运行15分钟后退出
    - name: CHAOS_CHANCE
      value: ".3"         # 30%混沌概率
规则组合使用
  • 逻辑与:同一pod-reaper实例启用多个规则时,仅当Pod满足所有规则才会被删除。
    sh
    # 示例:删除运行超过2小时且未就绪超过10分钟的Pod
    MAX_DURATION=2h
    MAX_UNREADY=10m
    
  • 逻辑或:需部署多个pod-reaper实例,每个实例配置单一规则。
    sh
    # 实例1:混沌概率规则
    CHAOS_CHANCE=.01
    # 实例2:运行时长规则
    MAX_DURATION=2h
    
注意事项
  • 自我保护:务必通过EXCLUDE_LABEL为pod-reaper自身添加排除标签,避免自我删除。
  • PDB兼容性:启用EVICT可尊重PodDisruptionBudget,适合生产环境。
  • 权限控制:最小化服务账户权限,避免跨命名空间过度权限。
  • 测试建议:首次使用时启用DRY_RUN=true验证规则效果,再实际执行删除。
查看更多 pod-reaper 相关镜像 →
smartcitiesdata/reaper logo
smartcitiesdata/reaper
用于运行`github.com/smartcitiesdata/reaper`应用程序的Docker镜像。
100K+ pulls
上次更新:未知
ohiosupercomputer/job-pod-reaper logo
ohiosupercomputer/job-pod-reaper
暂无描述
50K+ pulls
上次更新:未知
thelastpickle/cassandra-reaper logo
thelastpickle/cassandra-reaper
用于Apache Cassandra的Reaper构建版本的Docker镜像仓库
75M+ pulls
上次更新:未知
reaper99/recipya logo
reaper99/recipya
一个干净、简单且功能强大的食谱管理器,适合全家人共同使用。
100K+ pulls
上次更新:未知
webreaper/damselfly logo
webreaper/damselfly
Damselfly是一个基于服务器的数字资产管理系统,详情参见http://damselfly.info。
12500K+ pulls
上次更新:未知

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

MacOS OrbStack

MacOS OrbStack 容器配置

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
target/pod-reaper
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
咨询镜像拉取问题请 提交工单,官方技术交流群:1072982923
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
咨询镜像拉取问题请提交工单,官方技术交流群:
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.