GENCODE: comprehensive reference genome annotation for human and mouse

GENCODE:人类和小鼠的综合参考基因组注释

基本信息

  • 批准号:
    10709568
  • 负责人:
  • 金额:
    $ 296.77万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-04-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

Project Summary The GENCODE consortium creates foundational reference genome annotation for the human and mouse genomes in which all features are identified and classified with high accuracy based on biological evidence, and then freely released for the benefit of biomedical research and genome interpretation. GENCODE seeks to create annotation that increases the understanding of genome function in both human and mouse by prioritizing human disease genes and respecting the role of mouse as the major mammalian model organism. To effectively annotate genomes, GENCODE has created a suite of tools and draws on deep expertise across its partners across four fundamental components: 1) a comprehensive gene annotation pipeline leveraging manual and computational annotation; 2) a set of computational methods to evaluate and enhance gene annotation; 3) experimental pipelines targeted to expressed sequences less detectable in standard protocols; and 4) a machine learning capacity to improve all facets of the project. GENCODE will maintain a major focus on protein-coding and non-coding loci, including their alternatively spliced isoforms and pseudogenes and will extend expert manual review to small non-coding RNAs (ncRNA) and the annotation of non-polyadenylated transcripts. GENCODE will also expand regulatory annotation to a defined set of gene-associated features to more accurately reflect the interconnections between regulatory regions, including those with transcribed sequences such as ncRNA, and overall transcriptional output. GENCODE will take advantage of the increasing maturity of genomics technology including long-read transcriptome sequencing, functional genomics assays, and graph- based genome representations to identify features such as genes, pseudogenes, exons and splice sites that are incorrect, incomplete or in genome regions simply not present in the current reference assembly. More specifically, in the next four years GENCODE plans to 1) extend its human and mouse gene sets to as near completion as possible given available data and current experimental technology; 2) leverage new, high-quality human genome assemblies and targeted transcriptomic data to expand representation so that more human haplotypes will have high-quality annotation 3) annotate gene-associated regulatory regions including enhancer- promoter connections 4) collaborate with other resources to ensure a consistent representation of genic and regulatory features and reference transcripts for reporting clinical variation; and 5) distribute GENCODE annotations and engage with community annotation efforts to ensure accuracy and consistency. Primary GENCODE data will continue to be available from the Ensembl and UCSC Genome Browsers and the GENCODE web site. We will develop new mechanisms for effective two-way outreach, training and communication with the community with the long-term aim of establishing GENCODE as the standard annotation set for research and clinical genomics applications.
项目概要 GENCODE 联盟为人类和小鼠创建基础参考基因组注释 基因组中的所有特征均根据生物学证据进行高精度识别和分类,以及 然后免费发布以用于生物医学研究和基因组解释。 GENCODE 致力于 创建注释,通过优先考虑来增加对人类和小鼠基因组功能的理解 人类疾病基因并尊重小鼠作为主要哺乳动物模式生物的作用。为了有效地 为了注释基因组,GENCODE 创建了一套工具并利用其合作伙伴的深厚专业知识 跨越四个基本组成部分:1)利用手动和 计算注释; 2)一套评估和增强基因注释的计算方法; 3) 针对标准方案中不易检测到的表达序列的实验流程; 4) 一台机器 提高项目各个方面的学习能力。 GENCODE 将继续重点关注蛋白质编码 和非编码基因座,包括它们的选择性剪接亚型和假基因,并将扩展专家 对小非编码 RNA (ncRNA) 的手动审查以及非聚腺苷酸化转录本的注释。 GENCODE 还将把监管注释扩展到一组已定义的基因相关特征,以获取更多信息。 准确反映调节区域之间的互连,包括那些具有转录序列的区域 例如 ncRNA 和总体转录输出。 GENCODE 将利用日益成熟的技术 基因组学技术,包括长读长转录组测序、功能基因组学测定和图谱分析 基于基因组表示来识别基因、假基因、外显子和剪接位点等特征 不正确、不完整或基因组区域根本不存在于当前参考装配中。更多的 具体来说,在未来四年中,GENCODE 计划 1) 将其人类和小鼠基因集扩展到尽可能接近 考虑到现有数据和当前的实验技术,尽可能完成; 2)利用新的、高质量的 人类基因组组装和靶向转录组数据以扩大代表性,以便更多的人类 单倍型将具有高质量的注释 3) 注释基因相关的调控区域,包括增强子- 启动子连接 4) 与其他资源合作,确保基因和基因的一致表达 用于报告临床变异的监管特征和参考记录; 5) 分发 GENCODE 注释并参与社区注释工作以确保准确性和一致性。基本的 GENCODE 数据将继续从 Ensembl 和 UCSC 基因组浏览器以及 GENCODE 网站。我们将建立有效的双向推广、培训和培训新机制 与社区沟通,长期目标是建立 GENCODE 作为标准注释 用于研究和临床基因组学应用。

项目成果

期刊论文数量(68)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SQANTI: extensive characterization of long-read transcript sequences for quality control in full-length transcriptome identification and quantification.
  • DOI:
    10.1101/gr.222976.117
  • 发表时间:
    2018-03-01
  • 期刊:
  • 影响因子:
    7
  • 作者:
    Tardaguila M;de la Fuente L;Marti C;Pereira C;Pardo-Palacios FJ;Del Risco H;Ferrell M;Mellado M;Macchietto M;Verheggen K;Edelmann M;Ezkurdia I;Vazquez J;Tress M;Mortazavi A;Martens L;Rodriguez-Navarro S;Moreno-Manzano V;Conesa A
  • 通讯作者:
    Conesa A
Corrigendum: Loose ends: almost one in five human genes still have unresolved coding status.
  • DOI:
    10.1093/nar/gky1146
  • 发表时间:
    2018-12-14
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Abascal F;Juan D;Jungreis I;Kellis M;Martinez L;Rigau M;Rodriguez JM;Vazquez J;Tress ML
  • 通讯作者:
    Tress ML
A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes.
一种用于翻译后修饰和变异的肽到基因组映射的快速定量方法。
  • DOI:
    10.3791/57633
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Schlaffner,ChristophN;Pirklbauer,GeorgJ;Bender,Andreas;Steen,JudithAJ;Choudhary,JyotiS
  • 通讯作者:
    Choudhary,JyotiS
The value of primary transcripts to the clinical and non-clinical genomics community: Survey results and roadmap for improvements.
  • DOI:
    10.1002/mgg3.1786
  • 发表时间:
    2021-12
  • 期刊:
  • 影响因子:
    2
  • 作者:
    Morales J;McMahon AC;Loveland J;Perry E;Frankish A;Hunt S;Armean IM;Flicek P;Cunningham F
  • 通讯作者:
    Cunningham F
Alternative Splicing May Not Be the Key to Proteome Complexity.
  • DOI:
    10.1016/j.tibs.2016.08.008
  • 发表时间:
    2017-03
  • 期刊:
  • 影响因子:
    13.8
  • 作者:
    Tress ML;Abascal F;Valencia A
  • 通讯作者:
    Valencia A
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ewan Birney其他文献

Ewan Birney的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ewan Birney', 18)}}的其他基金

The medaka Kiyosu panel: dissecting GxE effects of environmental chemicals
青鳉 Kiyosu 小组:剖析环境化学品的 GxE 效应
  • 批准号:
    10331784
  • 财政年份:
    2019
  • 资助金额:
    $ 296.77万
  • 项目类别:
The medaka Kiyosu panel: dissecting GxE effects of environmental chemicals
青鳉 Kiyosu 小组:剖析环境化学品的 GxE 效应
  • 批准号:
    10551993
  • 财政年份:
    2019
  • 资助金额:
    $ 296.77万
  • 项目类别:
GENCODE: comprehensive reference genome annotation for human and mouse
GENCODE:人类和小鼠的综合参考基因组注释
  • 批准号:
    10488576
  • 财政年份:
    2013
  • 资助金额:
    $ 296.77万
  • 项目类别:
EDAC: ENCODE Data Analysis Center
EDAC:ENCODE数据分析中心
  • 批准号:
    7913074
  • 财政年份:
    2008
  • 资助金额:
    $ 296.77万
  • 项目类别:
EDAC: ENCODE Data Analysis Center
EDAC:ENCODE数据分析中心
  • 批准号:
    8494858
  • 财政年份:
    2008
  • 资助金额:
    $ 296.77万
  • 项目类别:
EDAC: ENCODE Data Analysis Center
EDAC:ENCODE数据分析中心
  • 批准号:
    7499147
  • 财政年份:
    2008
  • 资助金额:
    $ 296.77万
  • 项目类别:
EDAC: ENCODE Data Analysis Center
EDAC:ENCODE数据分析中心
  • 批准号:
    8107695
  • 财政年份:
    2008
  • 资助金额:
    $ 296.77万
  • 项目类别:
EDAC: ENCODE Data Analysis Center
EDAC:ENCODE数据分析中心
  • 批准号:
    7622614
  • 财政年份:
    2008
  • 资助金额:
    $ 296.77万
  • 项目类别:
Nomenclature of Human and Vertebrate Genes
人类和脊椎动物基因的命名法
  • 批准号:
    8721470
  • 财政年份:
    2004
  • 资助金额:
    $ 296.77万
  • 项目类别:
The Nomenclature of Human and Vertebrate Genes
人类和脊椎动物基因的命名法
  • 批准号:
    10456716
  • 财政年份:
    2004
  • 资助金额:
    $ 296.77万
  • 项目类别:

相似国自然基金

TRIM25介导的泛素化及ISGylation通过选择性剪接和糖代谢调控髓细胞分化
  • 批准号:
    82370111
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PRMT5选择性剪接异构体通过甲基化PDCD4调控肝癌辐射敏感性的机制研究
  • 批准号:
    82304081
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
ac4C乙酰化修饰的HnRNP L选择性剪接EIF4G1调控糖代谢重编程介导前列腺癌免疫检查点阻断治疗无应答的机制研究
  • 批准号:
    82303784
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
由CathepsinH介导的YAP选择性剪接在辐射诱导细胞死亡及辐射敏感性中的作用
  • 批准号:
    82373527
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
拟南芥剪接因子SR蛋白通过选择性剪接调控获得性耐热的机理研究
  • 批准号:
    32300247
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Generating a full-length reference transcriptome for human protein-coding genes
生成人类蛋白质编码基因的全长参考转录组
  • 批准号:
    10331602
  • 财政年份:
    2022
  • 资助金额:
    $ 296.77万
  • 项目类别:
Generating a full-length reference transcriptome for human protein-coding genes
生成人类蛋白质编码基因的全长参考转录组
  • 批准号:
    10687972
  • 财政年份:
    2022
  • 资助金额:
    $ 296.77万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10449388
  • 财政年份:
    2021
  • 资助金额:
    $ 296.77万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10211748
  • 财政年份:
    2021
  • 资助金额:
    $ 296.77万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10615135
  • 财政年份:
    2021
  • 资助金额:
    $ 296.77万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了