喵ID:WSFS1G免责声明

Ultrafast and scalable variant annotation and prioritization with big functional genomics data.

利用大功能基因组数据进行超快速且可扩展的变异注释和优先级排序

基本信息

DOI:
10.1101/gr.267997.120
发表时间:
2020-12
影响因子:
7
通讯作者:
Li MJ
中科院分区:
生物学1区
文献类型:
Journal Article
作者: Huang D;Yi X;Zhou Y;Yao H;Xu H;Wang J;Zhang S;Nong W;Wang P;Shi L;Xuan C;Li M;Wang J;Li W;Kwan HS;Sham PC;Wang K;Li MJ研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

The advances of large-scale genomics studies have enabled compilation of cell type–specific, genome-wide DNA functional elements at high resolution. With the growing volume of functional annotation data and sequencing variants, existing variant annotation algorithms lack the efficiency and scalability to process big genomic data, particularly when annotating whole-genome sequencing variants against a huge database with billions of genomic features. Here, we develop VarNote to rapidly annotate genome-scale variants in large and complex functional annotation resources. Equipped with a novel index system and a parallel random-sweep searching algorithm, VarNote shows substantial performance improvements (two to three orders of magnitude) over existing algorithms at different scales. It supports both region-based and allele-specific annotations and introduces advanced functions for the flexible extraction of annotations. By integrating massive base-wise and context-dependent annotations in the VarNote framework, we introduce three efficient and accurate pipelines to prioritize the causal regulatory variants for common diseases, Mendelian disorders, and cancers.
大规模基因组学研究的进展使得能够在高分辨率下汇编细胞类型特异性的全基因组DNA功能元件。随着功能注释数据和测序变异数量的不断增加,现有的变异注释算法缺乏处理大型基因组数据的效率和可扩展性,特别是在针对包含数十亿个基因组特征的庞大数据库对全基因组测序变异进行注释时。在此,我们开发了VarNote,以便在庞大且复杂的功能注释资源中快速注释基因组规模的变异。VarNote配备了一种新颖的索引系统和一种并行随机扫描搜索算法,在不同规模下,相较于现有算法,其性能有了显著提高(2到3个数量级)。它支持基于区域和等位基因特异性的注释,并引入了用于灵活提取注释的高级功能。通过在VarNote框架中整合大量基于碱基和依赖于上下文的注释,我们引入了三种高效且准确的流程,以便对常见疾病、孟德尔疾病和癌症的致病性调控变异进行优先级排序。
参考文献(0)
被引文献(0)
A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3
DOI:
10.4161/fly.19695
发表时间:
2012-04-01
期刊:
FLY
影响因子:
1.2
作者:
Cingolani, Pablo;Platts, Adrian;Ruden, Douglas M.
通讯作者:
Ruden, Douglas M.
A general framework for estimating the relative pathogenicity of human genetic variants.
DOI:
10.1038/ng.2892
发表时间:
2014-03
期刊:
NATURE GENETICS
影响因子:
30.8
作者:
Kircher, Martin;Witten, Daniela M.;Jain, Preti;O'Roak, Brian J.;Cooper, Gregory M.;Shendure, Jay
通讯作者:
Shendure, Jay
The mutational constraint spectrum quantified from variation in 141,456 humans.
DOI:
10.1038/s41586-020-2308-7
发表时间:
2020-05-01
期刊:
Nature
影响因子:
64.8
作者:
Karczewski, Konrad J;Francioli, Laurent C;MacArthur, Daniel G
通讯作者:
MacArthur, Daniel G
The UK Biobank resource with deep phenotyping and genomic data.
DOI:
10.1038/s41586-018-0579-z
发表时间:
2018-10
期刊:
Nature
影响因子:
64.8
作者:
Bycroft C;Freeman C;Petkova D;Band G;Elliott LT;Sharp K;Motyer A;Vukcevic D;Delaneau O;O'Connell J;Cortes A;Welsh S;Young A;Effingham M;McVean G;Leslie S;Allen N;Donnelly P;Marchini J
通讯作者:
Marchini J
An evolutionary framework for measuring epigenomic information and estimating cell-type-specific fitness consequences
DOI:
10.1038/s41588-018-0300-z
发表时间:
2019-02-01
期刊:
NATURE GENETICS
影响因子:
30.8
作者:
Gulko, Brad;Siepel, Adam
通讯作者:
Siepel, Adam

数据更新时间:{{ references.updateTime }}

关联基金

复杂疾病致病调控变异及其靶基因预测方法研究
批准号:
31871327
批准年份:
2018
资助金额:
60.0
项目类别:
面上项目
Li MJ
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓