专属域名
文档搜索
提交工单
轩辕助手
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
...
cogstacksystems/medcat-trainer
官方博客热门镜像提交工单
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 —— 国内开发者首选的专业 Docker 镜像加速平台。在线技术支持请优先 提交工单,技术交流欢迎加入官方QQ群:13763429 。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

medcat-trainer Docker 镜像下载 - 轩辕镜像

medcat-trainer 镜像详细信息和使用指南

medcat-trainer 镜像标签列表和版本信息

medcat-trainer 镜像拉取命令和加速下载

medcat-trainer 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

medcat-trainer
cogstacksystems/medcat-trainer

medcat-trainer 镜像详细信息

medcat-trainer 镜像标签列表

medcat-trainer 镜像使用说明

medcat-trainer 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

MedCATTrainer是基于Docker Compose打包的Django应用,提供界面用于构建、改进和定制生物医学领域的命名实体识别与链接(NER+L)模型(MedCAT),支持注释项目管理、概念注释验证、模型训练及导出。
1 收藏0 次下载activecogstacksystems镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

medcat-trainer 镜像详细说明

medcat-trainer 使用指南

medcat-trainer 配置说明

medcat-trainer 官方文档

Medical oncept Annotation Tool Trainer

MedCATTrainer是一个用于构建、改进和定制生物医学领域文本命名实体识别与链接(NER+L)模型(MedCAT)的界面。

MedCATTrainer在EMNLP/IJCNLP 2019会议上发布:论文链接

目录

  1. 安装
  2. 管理员设置
  3. 用户指南
    1. 创建注释项目
      1. 注意事项
    2. 注释界面
      1. 第1部分 - 文档摘要列表
      2. 第2部分 - 临床文本
        1. 添加注释
      3. 第3部分 - 操作栏
        1. 概念导航按钮
        2. 概念状态按钮
        3. 提交按钮
      4. 第4部分 - 头部工具栏
      5. 第5部分 - 概念摘要
    3. 元注释
      1. 元注释配置
    4. 项目与工具管理
      1. 配置概念选择器
      2. 下载注释
      3. 克隆项目
      4. 重置项目
      5. 保存模型
      6. 下载模型
  4. 注释指南
  5. 高级用法

安装

MedCATTrainer是一个基于Docker Compose打包的Django应用。

快速安装脚本会下载docker-compose文件、默认环境变量并运行它们。

  1. $ git clone [***] 
    

$ cd MedCATtrainer $ docker-compose up

如果您使用的是MedCAT v0.x模型,并希望使用该训练器,请使用以下docker-compose文件: 此文件引用了仍与MedCAT v0.x及以下版本兼容的最新训练器构建镜像。

$ docker-compose -f docker-compose-mc0x.yml up

如果构建失败并显示错误代码137,说明运行Docker守护进程的虚拟机内存不足。请在Docker守护进程设置的CLI或相关Docker GUI中增加容器的分配内存。

Mac系统:[***]

Windows系统:[***]

  1. MedCATTrainer现已运行:
  • 主应用可通过 http://localhost:8001/ 访问
  • 管理员应用可通过 http://localhost:8001/admin/ 访问

初始安装时,会设置示例管理员用户、示例数据集、概念数据库、词汇表和项目。下一部分将提供更多详细信息。

  1. (可选)可通过环境变量配置应用:
参数描述
MEDCAT_CONFIG_FILEMedCAT配置文件,详见此处
BEHIND_RP如果在反向代理后运行MedCATTrainer,设为1,否则默认0(即False)
MCTRAINER_PORT训练器应用运行的端口

设置这些变量后,重新运行docker-compose文件。如果已运行容器,需要先停止容器。

管理员设置

  1. 容器运行的是一个标准django应用,初始加载时会创建默认管理员用户,详情如下:

用户名:admin
密码:admin

  1. 强烈建议在生产环境中使用训练器并存储敏感临床文档前,创建新的管理员用户。要添加新用户,请导航至 http://localhost:8001/admin/ 并选择“Users”。

  1. 选择“Add User”并填写表单创建新用户名/密码。

  1. 创建后,选择新用户,勾选“Staff Status”( staff状态)或“Superuser Status”(超级用户状态),以允许用户访问管理员应用。

  2. 通过步骤2导航至默认管理员用户,选择该用户并执行删除操作,移除默认admin用户。

用户指南

演示

为便于演示和当前模型的常规测试,主屏幕的“Demo”(演示)选项卡提供了简化版的注释器。

该界面与真实项目的注释屏幕类似(详见此处),但无需特定数据集、过滤器设置和其他项目配置。此视图不允许对识别的概念进行“注释”(或添加新概念),但允许用户通过交互方式了解现有MedCAT模型的注释能力。

  1. 表单功能:
  • 选择要查看概念注释的项目模型。
  • 输入要注释并显示在2中的临床文本。
  • 可使用CUI和TUI过滤器仅显示2中感兴趣的概念。例如,对于UMLS CDB,T047可表示“疾病或综合征”。如果两个表单输入都有内容,CUI和TUI过滤器将组合使用。
  1. 此处显示示例临床文本,文本片段以蓝色高亮。点击任何注释可在3中显示链接的概念数据库详情。

  2. 从2中选择的概念的链接概念详情。

创建注释项目

通过管理员页面,已配置的超级用户可以创建、编辑和删除注释项目。

注释项目用于检查、验证和改进MedCAT识别的概念。

  1. 导航至 http://localhost:8001/admin/ 并选择“Project annotate entities”(项目注释实体)。

!主菜单列表

  1. 点击“Add Project Annotate Entities”(添加项目注释实体)。

!添加项目注释实体按钮

  1. 填写新注释项目表单。下表详细说明各字段的用途:
参数描述
Name项目名称,显示在登录页面
Description项目描述,显示在登录页面,例如“示例项目”
Members有权访问此项目的用户列表,点击“+”可创建新用户
Dataset要注释的文档集。数据集表格 schema 如下所述
Validated Documents忽略此列表。即将发布的高级管理员用户指南将说明此列表的用途
Cuis(可选)逗号分隔的概念唯一标识符(CUI)列表,用于仅显示此项目中的特定概念
CUI File(可选)JSON格式的CUI列表。如果项目需要基于CDB自省收集的大量CUI列表进行设置,此文件非常有用。将与上述“Cuis”列表合并
Concept DBMedCAT概念数据库。应为通过medcat.cdb.CDB.save_dict('name_of_cdb.dat')函数生成的文件。点击此处的“+”图标可打开上传CDB文件的对话框
vocabMedCAT词汇表。应为通过medcat.cdb.utils.Vocab.save_dict('name_of_vocab.dat')函数生成的文件。点击此处的“+”图标可打开上传词汇表文件的对话框
cdb_search_filter用于在文档添加注释过程中查找概念的CDB ID列表
Require Entity Validation(默认:True)勾选此选项后,界面中MedCAT生成的注释将显示为灰色,表示未经验证。文档提交前需用户标记所有灰色注释。未勾选时,所有注释默认标记为“有效”
Train Model On Submit(默认:True)勾选此选项后,每次文档提交都会使用该文档中标记和添加的注释训练配置的MedCAT实例。未勾选时,MedCAT模型不会在提交之间训练
Add New Entities(默认:False)勾选此选项后,允许用户向现有MedCAT CDB添加全新概念。未勾选时,此功能不可用
Restrict Concept Lookup(默认:False)勾选此选项后,概念查找(添加注释/选择替代概念)将仅包含上述过滤器中列出的CUI(来自CUI列表或上传的CUI文件)
Terminate Available(默认:True)勾选此选项后,将显示终止注释概念的选项
Irrelevant Available(默认:False)勾选此选项后,将显示标记注释概念为“无关”的选项
Tasks选择概念标记为正确后显示的“元注释”任务

数据集可上传CSV或XLSX格式文件。示例:

nametext
Doc 1示例文档文本
Doc 2更多示例文本

name列可选,若上传时未提供,将为每个文档自动生成名称。示例数据集位于docs/example_data/*.csv。

  1. 点击“Save”(保存)存储新项目。

  2. 导航至主屏幕(http://localhost:8001/),使用之前设置的用户名和密码登录。

  1. 选择新创建的项目开始注释文档。

注意事项

注意:示例概念数据库和词汇表可在MedCAT github免费获取。注意:UMLS和SNOMED-CT是许可产品,因此目前仅提供这些较小的训练概念/词汇数据库。

关于从各自源数据创建UMLS/SNOMED-CT CDB的更多文档将很快发布。

重要注意:任务允许创建元注释及其关联的注释者可用值集。例如,“元注释”可以是“时间性”,值可以是“过去”、“现在”、“未来”。

注意:当前不支持Firefox和IE浏览器。请使用Chrome或Safari。

注释界面

注释界面最初可分为5个部分。

第1部分 - 文档摘要列表

项目中待完成的文档列表。当前选中的文档左侧边框以蓝色高亮。已提交的文档标记有!tick_mark。

第2部分 - 临床文本

选中文档的文本,其中配置的MedCAT模型识别的每个概念都高亮显示。高亮文本片段指示注释状态:

  • 灰色:用户尚未审核由MedCAT识别并链接到CDB概念的文本片段。
  • 蓝色:用户已审核该片段并标记其链接的MedCAT概念正确。
  • 红色:用户已审核该片段并标记其链接的MedCAT概念不正确。
  • 深红色:用户已审核该片段并标记为终止,表示该文本片段不应再链接到此概念,告知MedCAT不再将该文本片段与此概念关联。
  • 青绿色:用户已审核该片段并标记为替代链接概念。用户通过“概念选择器”选择了应链接的正确概念。

添加注释

MedCAT可能会遗漏缩略语、缩写词或概念拼写错误的文本片段。可通过直接高亮文本片段、右键点击、选择“Add Term”(添加术语)、搜索概念(通过ID或名称)并选择添加术语来添加缺失的注释:

-> ->

选择:

  • Add Term(添加术语):将此注释添加到文本片段并链接所选概念
  • Cancel(取消):(快捷键esc)取消添加注释到文本。

第3部分 - 操作栏

概念导航

在文档中出现的概念列表之间导航:

  • 左右操作按钮
  • 键盘左右箭头键
  • 直接点击文本中的概念。

概念状态按钮

一个概念只能标记一种状态。状态会被记录,但仅在提交文档且项目配置了“Train Model On Submit”(提交时训练模型)时才会发送给MedCAT进行训练。

提交按钮

所有概念都经过审核并标记状态后,提交按钮才会启用。点击提交将显示包含注释摘要的确认对话框。确认提交后,所有新注释将发送到MedCATTrainer中间层,并重新训练MedCAT模型。之后将选择下一个文档,并使用新训练的MedCAT模型进行注释。

第4部分 - 头部工具栏

显示当前审核文档的名称和项目中剩余待注释文档的数量,操作按钮包括:

  • :当前注释摘要。提交注释确认前会显示类似视图。
  • :帮助对话框,显示文档和概念导航、概念注释及提交的快捷键。
  • :重置文档。如果错误添加或提交了注释,重置文档将清除所有先前的注释及其状态。

第5部分 - 概念摘要

列出当前选中概念的详情。

概念详情描述
Annotated Text链接到概念的文本片段
NameMedCAT CDB中的链接概念名称
Term ID概念所属的高层组ID。根据CDB是否包含TUI,可能显示“N/A”(不适用)
Concept IDMedCAT CDB中链接概念的唯一标识符
AccuracyMedCAT为该文本片段链接概念的准确度。如果CDB中该名称唯一标识该概念,文本片段的准确度为1.0
DescriptionMedCAT关联的概念描述。SNOMED-CT不提供概念描述,仅提供替代名称,而UMLS提供描述

元注释

MedCAT还能够学***覆盖在基础概念注释层之上的项目和上下文特定注释。

元注释的示例用例包括训练模型预测:

  • 所有疾病概念是否由患者、亲属经历,或不适用。
  • 所有症状概念在时间上是当前还是历史。
  • 所有药物概念是患者用药提及还是假设提及。
  • 患者的主诉是主要还是次要。

MedCATTrainer可通过管理员应用配置,以支持收集这些元注释。目前尚未集成概念识别的主动学***组件。

元注释配置

要创建新的元注释任务并附加到现有项目:

  1. 通过管理员页面(http://localhost:8001/admin/)进入项目配置设置。

  1. 在表单底部,点击+图标打开新元注释任务表单。

  1. 填写表单,并通过“+”图标和“values”(值)输入为任务添加所需的元任务值。值是特定任务的枚举选项,可跨项目重用或特定于项目。确保默认值是可用值之一。描述会显示在界面中的任务旁,并在帮助对话框中详细显示。

  1. 按住(ctrl/cmd)并点击元任务,选择所需的元注释任务,然后点击“Save”(保存)保存项目更改。

  1. 元注释现在会显示在该项目的界面中,位于概念摘要下方。元注释仅对标记为正确的概念显示。

项目/工具管理

概念选择器 - CDB概念导入

概念选择器用于:

  • 为现有识别的文本片段选择替代概念
  • “Add Term”(添加术语)过程中选择概念。

可用概念列表通过MedCAT CDB填充并建立索引,以支持快速的预输入式搜索。

SNOMED-CT/UMLS构建的数据库可能包含数千甚至数百万个概念,因此此过程以异步任务执行,确保管理员页面和应用仍可正常使用。

每个概念体系(如SNOMED-CT、UMLS是两个不同的概念体系)每个部署仅需执行一次此过程,

查看更多 medcat-trainer 相关镜像 →
kubeflow/trainer-huggingface logo
kubeflow/trainer-huggingface
by kubeflow
暂无描述
10K+ pulls
上次更新:4 个月前
kubeflow/trainer-controller-manager logo
kubeflow/trainer-controller-manager
by kubeflow
暂无描述
10K+ pulls
上次更新:2 天前
cogstacksystems/medcat-service logo
cogstacksystems/medcat-service
by cogstacksystems
将MedCAT NLP应用封装为REST API服务,支持通过API处理文本并返回医学实体注释,基于Flask构建,提供单文档和批量处理接口,适用于医学文本的NLP分析场景。
100K+ pulls
上次更新:2 天前

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker加速体验非常流畅,大镜像也能快速完成下载。"

用户评价详情

oldzhang - 运维工程师

Linux服务器

5

Docker加速体验非常流畅,大镜像也能快速完成下载。

Nana - 后端开发

Mac桌面

4.9

配置Docker镜像源后,拉取速度快了数倍,开发体验提升明显。

Qiang - 平台研发

K8s集群

5

轩辕镜像在K8s集群中表现很稳定,容器部署速度明显加快。

小敏 - 测试工程师

Windows桌面

4.8

Docker镜像下载不再超时,测试环境搭建更加高效。

晨曦 - DevOps工程师

宝塔面板

5

配置简单,Docker镜像源稳定,适合快速部署环境。

阿峰 - 资深开发

群晖NAS

5

在群晖NAS上配置后,镜像下载速度飞快,非常适合家庭实验环境。

俊仔 - 后端工程师

飞牛NAS

4.9

Docker加速让容器搭建顺畅无比,再也不用等待漫长的下载。

Lily - 测试经理

Linux服务器

4.8

镜像源覆盖面广,更新及时,团队一致反馈体验不错。

浩子 - 云平台工程师

Podman容器

5

使用轩辕镜像后,Podman拉取镜像稳定无比,生产环境可靠。

Kai - 运维主管

爱快路由

5

爱快系统下配置加速服务,Docker镜像拉取速度提升非常大。

翔子 - 安全工程师

Linux服务器

4.9

镜像源稳定性高,安全合规,Docker拉取无忧。

亮哥 - 架构师

K8s containerd

5

大规模K8s集群下镜像加速效果显著,节省了大量时间。

慧慧 - 平台开发

Docker Compose

4.9

配置Compose镜像加速后,整体构建速度更快了。

Tina - 技术支持

Windows桌面

4.8

配置简单,镜像拉取稳定,适合日常开发环境。

宇哥 - DevOps Leader

极空间NAS

5

在极空间NAS上使用Docker加速,体验流畅稳定。

小静 - 数据工程师

Linux服务器

4.9

Docker镜像源下载速度快,大数据环境搭建轻松完成。

磊子 - SRE

宝塔面板

5

使用轩辕镜像后,CI/CD流程整体快了很多,值得推荐。

阿Yang - 前端开发

Mac桌面

4.9

国内网络环境下,Docker加速非常给力,前端环境轻松搭建。

Docker迷 - 架构师

威联通NAS

5

威联通NAS下配置镜像加速后,Docker体验比官方源好很多。

方宇 - 系统工程师

绿联NAS

5

绿联NAS支持加速配置,Docker镜像下载快且稳定。

常见问题

Q1:轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

Q2:轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

Q3:流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

Q4:410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

Q5:manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

Q6:镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像加速服务

Windows/Mac

在 Docker Desktop 配置镜像加速

Docker Compose

Docker Compose 项目配置加速

K8s Containerd

Kubernetes 集群配置 Containerd

宝塔面板

在宝塔面板一键配置镜像加速

群晖

Synology 群晖 NAS 配置加速

飞牛

飞牛 fnOS 系统配置镜像加速

极空间

极空间 NAS 系统配置加速服务

爱快路由

爱快 iKuai 路由系统配置加速

绿联

绿联 NAS 系统配置镜像加速

威联通

QNAP 威联通 NAS 配置加速

Podman

Podman 容器引擎配置加速

Singularity/Apptainer

HPC 科学计算容器配置加速

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名加速

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
©2024-2025 源码跳动
商务合作电话:17300950906Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.