本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

ocrmypdf-watchdog Docker 镜像下载 - 轩辕镜像

ocrmypdf-watchdog 镜像详细信息和使用指南

ocrmypdf-watchdog 镜像标签列表和版本信息

ocrmypdf-watchdog 镜像拉取命令和加速下载

ocrmypdf-watchdog 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

ocrmypdf-watchdog
unze/ocrmypdf-watchdog

ocrmypdf-watchdog 镜像详细信息

ocrmypdf-watchdog 镜像标签列表

ocrmypdf-watchdog 镜像使用说明

ocrmypdf-watchdog 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

一个基于OCRMyPDF的监控工具,用于监控指定文件夹中的新文件,当检测到符合定义扩展名的文件时,自动运行OCRMyPDF(或自定义命令)将其转换为PDF,并支持文件备份和输出路径配置。
1 收藏0 次下载activeunze镜像

ocrmypdf-watchdog 镜像详细说明

ocrmypdf-watchdog 使用指南

ocrmypdf-watchdog 配置说明

ocrmypdf-watchdog 官方文档

ocrmypdf-watchdog

镜像概述和主要用途

ocrmypdf-watchdog 是一个基于 jbarlow83/ocrmypdf 镜像构建的监控工具,通过添加文件监控功能,实现对指定文件夹的自动化OCR处理。它能够监控目标文件夹中新增的、符合自定义扩展名的文件,并自动调用 OCRMyPDF(或其他指定命令)将文件转换为PDF格式,同时支持配置文件备份路径和输出路径。

核心功能和特性

  • 文件夹监控:实时监控指定输入文件夹(/in)中的新文件
  • 扩展名过滤:仅处理符合预定义扩展名的文件
  • 自动化转换:自动调用 OCRMyPDF 或自定义命令执行文件转换
  • 文件管理:支持配置备份路径(/bak)存储原始文件,输出路径(/out)存储转换后的PDF
  • 灵活配置:通过环境变量和命令行参数自定义路径、频率、命令及参数

使用场景和适用范围

  • 文档扫描自动化:扫描后的图片文件(如TIFF、PNG)自动转换为可搜索PDF
  • 批量文件处理:对指定目录中的历史文件或定期新增文件进行批量OCR转换
  • 自定义工作流:通过配置自定义命令和参数,适配非OCRMyPDF的文件转换需求

使用方法和配置说明

Docker部署

基本部署

通过 docker-compose 快速部署,默认会创建 /in(输入)、/bak(备份)、/out(输出)三个卷:

bash
docker-compose up -d

docker-compose.yml 示例

yaml
version: '3'
services:
  ocrmypdf-watchdog:
    image: ocrmypdf-watchdog
    volumes:
      - ./in:/in          # 输入文件夹(监控此目录的新文件)
      - ./bak:/bak        # 备份文件夹(存储原始文件)
      - ./out:/out        # 输出文件夹(存储转换后的PDF)
    environment:
      - OCRMYPDF_EXTENSIONS=pdf,tiff,png  # 监控的文件扩展名
      - WATCHDOG_FREQUENCY=10             # 监控频率(秒)
      - OCRMYPDF_PARAMETER=--force-ocr    # OCRMyPDF额外参数

环境变量配置

支持通过以下环境变量自定义行为:

环境变量说明
OCRMYPDF_IN输入文件夹路径(默认:/in
OCRMYPDF_BAK备份文件夹路径(默认:/bak
OCRMYPDF_OUT输出文件夹路径(默认:/out
OCRMYPDF_BINARYOCR转换命令路径(默认:ocrmypdf,可指定自定义命令)
OCRMYPDF_PARAMETEROCR命令的额外参数(如--force-ocr强制OCR,多个参数用空格分隔)
WATCHDOG_EXTENSIONS监控的文件扩展名(多个扩展名用逗号分隔,如pdf,tiff,png
WATCHDOG_FREQUENCY监控频率(秒,默认:5)

命令行参数

除环境变量外,还可通过命令行参数覆盖默认配置:

参数说明
--in <in-path>指定输入文件夹路径(覆盖 OCRMYPDF_IN
--bak <backup-path>指定备份文件夹路径(覆盖 OCRMYPDF_BAK
--out <out-path>指定输出文件夹路径(覆盖 OCRMYPDF_OUT
--frequency <seconds>指定监控频率(秒,覆盖 WATCHDOG_FREQUENCY
--ocrmypdf <path>指定OCR命令路径(覆盖 OCRMYPDF_BINARY

参数使用示例

bash
docker run --rm -v ./in:/in -v ./out:/out ocrmypdf-watchdog \
  --in /in \
  --out /out \
  --frequency 15 \
  --ocrmypdf /usr/local/bin/ocrmypdf

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker加速体验非常流畅,大镜像也能快速完成下载。"