最新消息:雨落星辰是一个专注网站SEO优化、网站SEO诊断、搜索引擎研究、网络营销推广、网站策划运营及站长类的自媒体原创博客

基准测试:DeepVariant进行WES变异检测

网站源码admin2浏览0评论

基准测试:DeepVariant进行WES变异检测

本文以人 WES 测序数据为例,演示 DeepVariant 软件进行变异检测的基准测试过程。

工具地址:

usegalaxy 网站,搜索工具:DeepVariant

数据下载

瓶中基因组基准数据

我们将使用瓶中基因组小变异基准数据集 v4.2.1 对 HG003 样本进行基准测试。

代码语言:javascript代码运行次数:0运行复制
mkdir -p benchmark

FTPDIR=.2.1/GRCh38

curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi
HG003 BAM
代码语言:javascript代码运行次数:0运行复制
mkdir -p input
HTTPDIR=

curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam > input/HG003.novaseq.wes_idt.100x.dedup.bam
curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam.bai > input/HG003.novaseq.wes_idt.100x.dedup.bam.bai
捕获目标 BED 文件

在本案例研究中,我们将使用idt_capture_novogene.grch38.bed作为捕获目标 BED 文件。为了进行评估,hap.py将使该 BED 与 GIAB 置信区域相交。

代码语言:javascript代码运行次数:0运行复制
HTTPDIR=

curl ${HTTPDIR}/idt_capture_novogene.grch38.bed > input/idt_capture_novogene.grch38.bed
参数设置
  • • 参考基因组来源:GRCh38
  • • BAM 文件:HG003.novaseq.wes_idt.100x.dedup.bam
  • • 模型类型:WES
  • • 选择特定区域进行处理
    • • BED 文件:idt_capture_novogene.grch38.bed

基准测试

安装 hap.py

从网站 .py 下载测试软件。

测试
代码语言:javascript代码运行次数:0运行复制
hap.py \
  ../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz \
  deepvariant.vcf \
  -f ../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed \
  -T ../input/idt_capture_novogene.grch38.bed \
  -r /path/to/Homo_sapiens_assembly38.fasta \
  -o benchmark \
  --pass-only
结果

评估摘要:

  • • INDEL 真阳性率:0.9705,精确性:0.9914
  • • SNP 真阳性率:0.9884,精确性:0.9975
计算效率
  • • 4 线程:耗时 51 分钟,内存占用 13.3 GB。
  • • 8 线程:耗时 24 分钟,内存占用 14.7 GB。

参考资料

.8/docs/deepvariant-exome-case-study.md

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-01,如有侵权请联系 cloudcommunity@tencent 删除数据线程测试工具内存
发布评论

评论列表(0)

  1. 暂无评论