DeepVariant 是一种基于深度学习的变体调用程序,它采用对齐读取(BAM 或 CRAM 格式),从中生成堆积图像张量,使用卷积神经网络对每个张量进行分类,最后在标准 VCF 或 gVCF 文件中报告结果。
DeepVariant 支持二倍体生物中的种系变异检出。
另请注意:
DeepTrio 是一个基于深度学习的三重奏变体调用程序,构建在 DeepVariant 之上。DeepTrio 扩展了 DeepVariant 的功能,使其能够利用神经网络的强大功能来预测
DeepTrio 支持在二倍体生物中对以下类型的输入数据进行种系变异检出:
另请注意:
[hidecontent type="logged" desc="隐藏内容:登录后可查看"]
我们推荐使用我们的 Docker 解决方案。该命令将如下所示:
BIN_VERSION="1.4.0"
docker run \
-v "YOUR_INPUT_DIR":"/input" \
-v "YOUR_OUTPUT_DIR:/output" \
google/deepvariant:"${BIN_VERSION}" \
/opt/deepvariant/bin/run_deepvariant \
--model_type=WGS \ **Replace this string with exactly one of the following [WGS,WES,PACBIO,HYBRID_PACBIO_ILLUMINA]**
--ref=/input/YOUR_REF \
--reads=/input/YOUR_BAM \
--output_vcf=/output/YOUR_OUTPUT_VCF \
--output_gvcf=/output/YOUR_OUTPUT_GVCF \
--num_shards=$(nproc) \ **This will use all your cores to run make_examples. Feel free to change.**
--logging_dir=/output/logs \ **Optional. This saves the log output for each stage separately.
--dry_run=false **Default is false. If set to true, commands will be printed out but not executed.
要查看您可以使用的所有标志,请运行:docker run google/deepvariant:"${BIN_VERSION}"
如果您使用的是 GPU,或者想改用 Singularity,请参阅 快速入门了解更多详细信息或查看所有可用的 设置选项。
有关详细信息,另请参阅:
如果您在工作中使用 DeepVariant,请引用:
使用深度神经网络的通用 SNP 和小插入缺失变体调用程序。自然生物技术36, 983–987 (2018)。 Ryan Poplin、Pi-Chuan Chang、David Alexander、Scott Schwartz、Thomas Colthurst、Alexander Ku、Dan Newburger、Jojo Dijamco、Nam Nguyen、Pegah T. Afshar、Sam S. Gross、Lizzie Dorfman、Cory Y. McLean 和 Mark A . DePristo。 doi: https://doi.org/10.1038/nbt.4235
此外,如果您使用我们的 DeepVariant 和 GLnexus 最佳实践生成多样本调用,请引用:
使用 DeepVariant 和 GLnexus 进行准确、可扩展的队列变体调用。 生物信息学(2021)。 Taedong Yun、Helen Li、Pi-Chuan Chang、Michael F. Lin、Andrew Carroll 和 Cory Y. McLean。 doi: https://doi.org/10.1093/bioinformatics/btaa1081
有关 pileup 图像以及如何阅读它们的更多信息,请参阅 “通过 DeepVariant 的眼睛看”博文。
DeepVariant 依赖于Nucleus,这是一个 Python 和 C++ 代码库,用于以常见的基因组学文件格式(如 SAM 和 VCF)读取和写入数据,旨在与 TensorFlow机器学习框架轻松集成。Nucleus 在构建时考虑了 DeepVariant 并单独开源,因此基因组学研究社区中的任何人都可以将其用于其他项目。请参阅这篇关于使用 Nucleus 和 TensorFlow 进行 DNA 测序错误校正的博客文章 。
以下是 Genomics 团队在 Google Health中提供的官方解决方案。
[/hidecontent]