本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

delly Docker 镜像下载 - 轩辕镜像

delly 镜像详细信息和使用指南

delly 镜像标签列表和版本信息

delly 镜像拉取命令和加速下载

delly 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

delly
dellytools/delly
自动构建

delly 镜像详细信息

delly 镜像标签列表

delly 镜像使用说明

delly 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

Delly是通过整合双端和分裂读段分析实现结构变异检测的工具。
3 收藏0 次下载activedellytools镜像

delly 镜像详细说明

delly 使用指南

delly 配置说明

delly 官方文档

Delly 镜像技术文档

镜像概述和主要用途

Delly 是一种集成的结构变异(SV)预测方法,能够在短读长大规模并行测序数据中以单核苷酸分辨率发现、基因分型和可视化缺失、串联重复、倒位和易位。它使用配对末端、分裂读取和读取深度来敏感且准确地描绘整个基因组的基因组重排。结构变异可使用 Delly-maze 和 Delly-suave 进行可视化。

核心功能和特性

  • 支持发现、基因分型和可视化多种结构变异类型(缺失、串联重复、倒位和易位)
  • 利用配对末端、分裂读取和读取深度信息提高检测准确性
  • 输出符合BCF格式,支持与bcftools等工具集成
  • 支持生殖系和体细胞结构变异检测
  • 提供长读长(PacBio或ONT)模式
  • 支持OpenMP多线程并行计算
  • 可生成读取深度剖面用于拷贝数分析
  • 提供专门的生殖系和体细胞结构变异过滤算法

使用场景和适用范围

  • 短读长高通量测序数据的结构变异分析
  • 生殖系结构变异检测与基因分型
  • 肿瘤样本的体细胞结构变异检测
  • 基于PacBio或ONT长读长数据的结构变异分析
  • 群体规模的结构变异研究
  • 临床样本中的结构变异筛查
  • 拷贝数变异分析与可视化

详细的使用方法和配置说明

基本要求

  • 输入样本需提供经过排序、索引和重复标记的BAM文件
  • 需要索引的参考基因组FASTA文件
  • 建议使用BCFtools进行格式转换和后续分析

Docker 部署方案

基本 Docker 运行命令

bash
docker run -v /path/to/data:/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam

Docker Compose 配置示例

yaml
version: '3'
services:
  delly:
    image: dellytools/delly
    volumes:
      - /path/to/local/data:/data
    environment:
      - OMP_NUM_THREADS=4
    command: delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam

多线程配置

Delly支持使用OpenMP API进行并行计算,通过以下方式启用:

bash
# 设置线程数环境变量
export OMP_NUM_THREADS=4
# 或在Docker运行时设置
docker run -e OMP_NUM_THREADS=4 dellytools/delly ...

注意:OMP_NUM_THREADS 应始终小于或等于输入样本的数量,因为Delly主要在样本级别进行并行化。

基本使用方法

标准结构变异检测

bash
delly call -x <排除区域文件> -o <输出文件.bcf> -g <参考基因组.fa> <输入.bam>

示例:

bash
docker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/delly.bcf -g /data/hg19.fa /data/input.bam

# 转换为VCF格式(需要BCFtools)
bcftools view /data/delly.bcf > /data/delly.vcf

长读长模式(PacBio或ONT)

ONT数据:

bash
docker run -v $(pwd):/data dellytools/delly delly lr -y ont -g /data/hg19.fa -x /data/hg19.excl /data/input.bam

PacBio数据:

bash
docker run -v $(pwd):/data dellytools/delly delly lr -y pb -g /data/hg19.fa -x /data/hg19.excl /data/input.bam

高级工作流程

体细胞结构变异检测流程

  1. 体细胞结构变异发现(需要至少一个肿瘤样本和一个匹配的对照样本):
bash
docker run -v $(pwd):/data dellytools/delly delly call -x /data/hg19.excl -o /data/t1.bcf -g /data/hg19.fa /data/tumor1.bam /data/control1.bam
  1. 体细胞预过滤(需要样本描述文件):
bash
# 样本描述文件格式(samples.tsv):
# sample_id	type
# tumor1	tumor
# control1	control

docker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.pre.bcf -s /data/samples.tsv /data/t1.bcf
  1. 在更大的对照样本组中进行基因分型
bash
docker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/t1.pre.bcf -o /data/geno.bcf -x /data/hg19.excl /data/tumor1.bam /data/control1.bam ... /data/controlN.bam
  1. 使用所有对照样本进行体细胞SV后过滤
bash
docker run -v $(pwd):/data dellytools/delly delly filter -f somatic -o /data/t1.somatic.bcf -s /data/samples.tsv /data/geno.bcf

生殖系结构变异检测流程

  1. 对每个样本进行SV检测
bash
docker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -o /data/s1.bcf -x /data/hg19.excl /data/sample1.bam
  1. 合并SV位点
bash
docker run -v $(pwd):/data dellytools/delly delly merge -o /data/sites.bcf /data/s1.bcf /data/s2.bcf ... /data/sN.bcf
  1. 对所有样本进行基因分型
bash
docker run -v $(pwd):/data dellytools/delly delly call -g /data/hg19.fa -v /data/sites.bcf -o /data/s1.geno.bcf -x /data/hg19.excl /data/s1.bam
  1. 合并所有基因分型结果
bash
bcftools merge -m id -O b -o merged.bcf s1.geno.bcf s2.geno.bcf ... sN.geno.bcf
  1. 应用生殖系SV过滤
bash
docker run -v $(pwd):/data dellytools/delly delly filter -f germline -o /data/germline.bcf /data/merged.bcf

读取深度剖面分析

  1. 生成读取深度剖面(需要可映射性图谱):
bash
docker run -v $(pwd):/data dellytools/delly delly rd -a -g /data/hg19.fa -m /data/hg19.map /data/input.bam
  1. 可视化归一化的拷贝数剖面
bash
Rscript R/rd.R out.cov.gz
  1. GC偏倚可视化
bash
docker run -v $(pwd):/data dellytools/delly delly rd -s /data/stats.gz -g /data/hg19.fa -m /data/hg19.map /data/input.bam
zgrep "^GC" stats.gz > gc.table
Rscript R/gcbias.R gc.table

常用参数说明

参数描述
-g索引的参考基因组FASTA文件
-x排除区域文件(例如着丝粒、端粒区域)
-o输出文件路径
-v输入的变异位点文件(用于基因分型)
-f过滤模式(somatic或germline)
-s样本描述文件(用于体细胞过滤)
-y长读长技术类型(ont或pb)
-a生成所有窗口的覆盖度,不仅是潜在的SV区域
-m可映射性图谱文件

常见问题解答

Q: Delly能检测的最小SV大小是多少?
A: 这取决于插入大小分布的锐度。对于200-300bp的插入大小和20-30bp的标准偏差,Delly开始检测≥300bp的可靠SV。Delly还支持仅使用软剪辑读取调用小的InDel,最小可检测15bp的SV。

Q: Delly可以用于非二倍体基因组吗?
A: 部分支持。SV位点发现适用于任何倍性。然而,Delly的基因分型模型假设二倍体(纯合参考、杂合和纯合替代)。

Q: Delly运行太慢,有什么解决方法?
A: 应排除端粒和着丝粒区域以及所有未放置的contigs。Delly为人和小鼠样本提供了此类排除列表。此外,可以使用-q 20和-s 15更严格地过滤输入读取。

Q: 是否允许非唯一比对、多重映射和/或多重分裂读取比对?
A: Delly期望每个配对末端在bam文件中有两个比对记录,一个用于第一个读取,一个用于第二个读取。给定读取的多个分裂读取比对记录是允许的,前提是其中一个是主要比对,而所有其他的被标记为次要或补充(flag 0x0100或flag 0x0800)。这是bwa mem的默认行为。

Q: BAM文件需要哪些预处理?
A: BAM文件需要排序、索引,理想情况下还需要重复标记。

引用和许可证

引用

Tobias Rausch, Thomas Zichner, Andreas Schlattl, Adrian M. Stuetz, Vladimir Benes, Jan O. Korbel.
DELLY: structural variant discovery by integrated paired-end and split-read analysis.
Bioinformatics. 2012 Sep 15;28(18):i333-i339.
[***]

许可证

Delly 根据BSD 3-Clause许可证分发。有关更多详情,请参阅LICENSE文件。

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker加速体验非常流畅,大镜像也能快速完成下载。"