数据处理和转换服务。
什么是MCP Server?
| 属性 | 详情 |
|---|---|
| Docker镜像 | mcp/aws-dataprocessing-mcp-server |
| 作者 | awslabs |
| 仓库 | [***] |
| 属性 | 详情 |
|---|---|
| Dockerfile | [***] |
| Docker镜像构建者 | Docker Inc. |
| Docker Scout健康评分 | !Docker Scout Health Score |
| 验证签名 | COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/aws-dataprocessing-mcp-server --key [***] |
| 许可证 | Apache License 2.0 |
| 服务提供的工具 | 简短描述 |
|---|---|
add_inline_policy | 向IAM角色添加新的内联策略。 |
analyze_s3_usage_for_data_processing | 分析数据处理服务(Glue、EMR、Athena)的S3存储桶使用模式。 |
create_data_processing_role | 为数据处理服务创建新的IAM角色。 |
get_policies_for_role | 获取附加到IAM角色的所有策略。 |
get_roles_for_service | 获取可由特定AWS服务承担的所有IAM角色。 |
list_s3_buckets | 列出名称中包含“glue”且位于指定区域的S3存储桶。 |
manage_aws_athena_data_catalogs | 管理AWS Athena数据目录,支持读写操作。 |
manage_aws_athena_databases_and_tables | 管理AWS Athena数据库和表,支持只读操作。 |
manage_aws_athena_named_queries | 管理AWS Athena中的已保存SQL查询。 |
manage_aws_athena_query_executions | 执行和管理AWS Athena SQL查询。 |
manage_aws_athena_workgroups | 管理AWS Athena工作组,支持读写操作。 |
manage_aws_emr_clusters | 全面控制EMR集群生命周期,管理AWS EMR EC2集群。 |
manage_aws_emr_ec2_instances | 管理AWS EMR EC2实例,支持读写操作。 |
manage_aws_emr_ec2_steps | 管理AWS EMR EC2步骤,用于在EMR集群上处理数据。 |
manage_aws_glue_catalog | 管理AWS Glue数据目录,支持读写操作。 |
manage_aws_glue_classifiers | 管理AWS Glue分类器,以确定数据格式和模式。 |
manage_aws_glue_connections | 管理AWS Glue数据目录连接,支持读写操作。 |
manage_aws_glue_crawler_management | 管理AWS Glue爬虫调度并监控性能指标。 |
manage_aws_glue_crawlers | 管理AWS Glue爬虫,以发现和编目数据源。 |
manage_aws_glue_databases | 管理AWS Glue数据目录数据库,支持读写操作。 |
manage_aws_glue_encryption | 管理AWS Glue数据目录加密设置,用于数据保护。 |
manage_aws_glue_jobs | 管理AWS Glue ETL作业和作业运行,支持读写操作。 |
manage_aws_glue_partitions | 管理AWS Glue数据目录分区,支持读写操作。 |
manage_aws_glue_resource_policies | 管理AWS Glue资源策略,用于访问控制。 |
manage_aws_glue_security_configurations | 管理AWS Glue安全配置,用于数据加密。 |
manage_aws_glue_sessions | 管理AWS Glue交互式会话,用于运行Spark和Ray工作负载。 |
manage_aws_glue_statements | 管理AWS Glue交互式会话语句,用于执行代码和检索结果。 |
manage_aws_glue_tables | 管理AWS Glue数据目录表,支持读写操作。 |
manage_aws_glue_triggers | 管理AWS Glue触发器,以自动化工作流和作业执行。 |
manage_aws_glue_usage_profiles | 管理AWS Glue使用配置文件,用于资源分配和成本管理。 |
manage_aws_glue_workflows | 管理AWS Glue工作流,以编排复杂的ETL活动。 |
upload_to_s3 | 使用putObject将Python代码内容直接上传到S3存储桶。 |
add_inline_policy向IAM角色添加新的内联策略。
此工具创建具有指定权限的新内联策略,并将其添加到IAM角色。内联策略嵌入在角色中,不能附加到多个角色。通常用于授予数据处理服务对AWS资源的访问权限,启用Glue作业访问数据源,以及配置CloudWatch日志和S3访问权限。
--allow-write标志运行permissions参数可以是单个策略语句或语句列表。
json{ "Effect": "Allow", "Action": ["s3:GetObject", "s3:PutObject"], "Resource": "arn:aws:s3:::example-bucket/*" }
json{ "Effect": "Allow", "Action": [ "glue:*", "s3:GetObject", "s3:PutObject", "s3:DeleteObject", "s3:ListBucket", "iam:PassRole" ], "Resource": "*" }
json{ "Effect": "Allow", "Action": [ "elasticmapreduce:*", "ec2:DescribeInstances", "ec2:DescribeSecurityGroups", "s3:ListBucket", "s3:GetObject", "s3:PutObject" ], "Resource": "*" }
json{ "Effect": "Allow", "Action": [ "athena:*", "glue:GetDatabase", "glue:GetTable", "glue:GetPartition", "s3:GetObject", "s3:ListBucket", "s3:PutObject" ], "Resource": "*" }
| 参数 | 类型 | 描述 |
|---|---|---|
permissions | string | 要包含在策略中的权限,格式为JSON格式的IAM策略语句。可以是单个语句对象或语句对象数组。 |
policy_name | string | 要创建的内联策略的名称。在角色内必须唯一。 |
role_name | string | 要添加策略的IAM角色的名称。该角色必须存在。 |
analyze_s3_usage_for_data_processing分析数据处理服务(Glue、EMR、Athena)的S3存储桶使用模式。
此工具帮助识别哪些存储桶被数据处理服务积极使用,哪些可能处于空闲或未充分利用状态。
| 参数 | 类型 | 描述 |
|---|---|---|
bucket_name | string 可选 | 要分析的特定存储桶(留空则分析所有存储桶) |
create_data_processing_role为数据处理服务创建新的IAM角色。
此工具创建具有指定数据处理服务(Glue、EMR或Athena)适当信任关系的新IAM角色。它还可以附加托管策略并向内联策略添加权限。
--allow-write标志运行建议添加以下策略:
| 参数 | 类型 | 描述 |
|---|---|---|
role_name | string | 要创建的IAM角色的名称。在您的AWS账户中必须唯一。 |
service_type | string | 数据处理服务类型:'glue'、'emr'或'athena'。 |
description | string 可选 | IAM角色的可选描述。 |
inline_policy | string 可选 | 要添加到角色的可选内联策略。 |
managed_policy_arns | string 可选 | 要附加到角色的可选托管策略ARN列表。 |
get_policies_for_role获取附加到IAM角色的所有策略。
此工具检索与IAM角色关联的所有策略,提供角色权限和信任关系的全面视图。它帮助您了解当前权限,识别缺失或过多的权限,排查数据处理问题,并验证服务角色的信任关系。
响应包括角色ARN、假设角色策略文档(信任关系)、角色描述、托管策略及其文档,以及内联策略及其文档。
| 参数 | 类型 | 描述 |
|---|---|---|
role_name | string | 要获取策略的IAM角色的名称。该角色必须存在于您的AWS账户中。 |
get_roles_for_service获取可由特定AWS服务承担的所有IAM角色。
此工具检索您AWS账户中所有与指定服务具有信任关系的IAM角色。它帮助您识别可用于Glue作业、EMR集群或Athena查询等服务的角色,使您在创建这些资源时更容易选择合适的角色。
常见服务类型包括:
响应包括可由指定服务承担的角色列表,包含角色名称、ARN、描述、创建日期以及完整的假设角色策略文档等详细信息。
| 参数 | 类型 | 描述 |
|---|---|---|
service_type | string | 数据处理服务类型:'glue'、'emr'、'athena'或其他AWS服务名称。 |
list_s3_buckets列出名称中包含“glue”且位于指定区域的S3存储桶。
此工具帮助识别通常用于数据处理工作流的S3存储桶,特别是与AWS Glue操作相关的存储桶。它提供使用统计信息和空闲时间信息,以帮助进行资源管理。
响应包括存储桶名称、创建日期、区域、对象计数、最后修改日期和空闲时间分析。
| 参数 | 类型 | 描述 |
|---|---|---|
region | string 可选 | 用于筛选存储桶的AWS区域(默认为AWS_REGION环境变量) |
manage_aws_athena_data_catalogs管理AWS Athena数据目录,支持读写操作。
此工具提供管理Athena数据目录的操作,包括创建、检索、列出、更新和删除数据目录。数据目录用于组织和访问Athena中的数据源,使您能够跨各种源(如AWS Glue数据目录、Apache Hive元存储或联邦源)查询数据。
--allow-write标志运行# 列出所有数据目录 {'operation': 'list-data-catalogs', 'max_results': 10} # 创建Glue数据目录 { 'operation': 'create-data-catalog', 'name': 'my-glue-catalog', 'type': 'GLUE', 'description': '我的Glue数据目录', 'parameters': {'catalog-id': '123456789012'}, }
| 参数 | 类型 | 描述 |
|---|---|---|
operation | string | 要执行的操作:create-data-catalog、delete-data-catalog、get-data-catalog、list-data-catalogs、update-data-catalog。当禁用写访问时选择只读操作。 |
delete_catalog_only | string 可选 | 对于delete-data-catalog操作,是否仅删除Athena数据目录(true)还是也删除其资源(false)。仅适用于FEDERATED目录。 |
description | string 可选 | 数据目录的描述(create-data-catalog和update-data-catalog可选)。 |
max_results | string 可选 | list-data-catalogs操作返回的最大结果数(范围:2-50)。 |
name | string 可选 | 数据目录名称(create-data-catalog、delete-data-catalog、get-data-catalog、update-data-catalog必需)。目录名称 |

来自真实用户的反馈,见证轩辕镜像的优质服务
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像加速服务
在 Docker Desktop 配置镜像加速
Docker Compose 项目配置加速
Kubernetes 集群配置 Containerd
在宝塔面板一键配置镜像加速
Synology 群晖 NAS 配置加速
飞牛 fnOS 系统配置镜像加速
极空间 NAS 系统配置加速服务
爱快 iKuai 路由系统配置加速
绿联 NAS 系统配置镜像加速
QNAP 威联通 NAS 配置加速
Podman 容器引擎配置加速
HPC 科学计算容器配置加速
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名加速
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429