Learning the Regulatory Code of Alzheimer's Disease Genomes

学习阿尔茨海默病基因组的调控密码

基本信息

项目摘要

With ageing populations world-wide, neurodegenerative diseases are placing an ever increasing burden on long- term well-being, healthcare costs and family life. Despite decades of research and enormous investment, no disease-modifying treatment is available for the most common of these diseases: Alzheimer’s (AD). The majority of these, to-date unsuccessful, efforts have focused on one potential cause of AD: amyloid-β aggregation. Combining population-scale data collection, human genetics and machine learning provides a way forward to uncover and characterize new causal cellular processes involved in AD. This would provide an array of potential therapeutic targets, increasing the chance that one will be more easily modulated than the amyloid-β pathway. AD-specific genomic datasets of unprecedented scale are being actively collected: whole genome sequencing (WGS) from ~20k individuals, gene expression (RNA-seq) and epigenomics (ATAC-seq, histone ChIP-seq) from >1000 post-mortem AD brains, single-cell transcriptomes and similar modalities in peripheral and brain-resident innate immune cells (which we and others have shown to be AD-relevant). Effectively integrating these diverse data to better understand AD represents a substantial computational challenge, both in terms of data scale and analysis complexity. This proposal leverages state-of-the-art deep learning (DL) and machine learning (ML), combined with human genetic analyses, to address this challenge. We will train DL models to predict epigenomic signals and RNA splicing from genomic sequence, enabling in silico mutagenesis to estimate the functional impact (a “delta score”) of any genetic variant. The delta scores will be used in genetic analyses that distinguish causal associations: cellular changes that drive AD pathogenesis rather than downstream/side effects of disease. Delta scores will aid in associating both rare and common variants to AD. To achieve sufficient power, rare variants must be aggregated (e.g. for a gene): delta scores will allow filtering out many likely non-functional (particularly non-coding) variants. Most common variants from AD Genome Wide Association Studies (GWAS) are simply correlated with the causal variant due to linkage disequilibrium (LD). Delta scores, combined with trans-ethnic GWAS, will enable estimation of the likely causal variant(s). These analyses will highlight variants and genes involved in AD. However, genes do not operate in a vacuum so robust probabilistic ML will be used to learn cell-type and disease-specific gene regulatory networks from sorted bulk and single-cell RNA-seq. The detected networks will be integrated with our genetic findings to discover network neighborhoods/pathways especially enriched in AD variants. Such pathways will be prime candidates for future functional and therapeutic studies of AD.
随着世界范围内人口老龄化,神经退行性疾病的发病率不断增加 尽管进行了数十年的研究和研究,但仍对长期福祉、医疗费用和家庭生活造成负担。 巨额投资,但对于其中最常见的疾病尚无缓解疾病的治疗方法 疾病:阿尔茨海默氏症(AD),其中大多数迄今尚未成功,但已集中努力。 AD 的一个潜在原因:淀粉样蛋白-β 聚集。 收集、人类遗传学和机器学习提供了一条前进的道路来发现和表征 AD 中涉及的新的因果细胞过程这将提供一系列潜在的治疗方法。 目标,增加了一种比淀粉样蛋白-β途径更容易调节的机会。 正在积极收集前所未有规模的 AD 特异性基因组数据集:全基因组 对约 20k 个体进行测序 (WGS)、基因表达 (RNA-seq) 和表观基因组学 (ATAC-seq、 组蛋白 ChIP-seq) > 1000 个死后 AD 大脑、单细胞转录组以及外周和外周组织中的类似模式 大脑固有免疫细胞(我们和其他人已证明其与 AD 有效相关)。 整合这些不同的数据以更好地理解 AD 代表着大量的计算 该提案利用了数据规模和分析复杂性方面的挑战。 最先进的深度学习(DL)和机器学习(ML),与人类遗传相结合 分析,以应对这一挑战。我们将训练深度学习模型来预测表观基因组信号和 来自基因组序列的 RNA 剪接,能够通过计算机诱变来估计 任何遗传变异的功能影响(“德尔塔分数”) 德尔塔分数将用于。 区分因果关系的遗传分析:导致 AD 的细胞变化 Delta 分数将有助于了解发病机制,而不是疾病的下游/副作用。 将稀有变体和常见变体与 AD 相关联 为了获得足够的功效,必须将稀有变体与 AD 相关联。 聚合(例如对于基因):增量分数将允许过滤掉许多可能的非功能性 (特别是非编码)变异来自 AD 全基因组关联研究。 (GWAS)由于连锁不平衡(LD)而与因果变异简单相关。 分数与跨种族 GWAS 相结合,将能够估计可能的因果变异。 这些分析将突出显示与 AD 相关的变异和基因。然而,基因并不在 AD 中发挥作用。 真空如此强大的概率机器学习将用于学习细胞类型和疾病特异性基因 来自分选的批量和单细胞 RNA-seq 的调控网络将是 与我们的遗传发现相结合,特别是发现网络邻居/路径 丰富的 AD 变体将成为未来功能和功能的主要候选途径。 AD 的治疗研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

David Arthur Knowles其他文献

David Arthur Knowles的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('David Arthur Knowles', 18)}}的其他基金

Delineating the network effects of mental disorder-associated variants using convex optimization methods
使用凸优化方法描述精神障碍相关变异的网络效应
  • 批准号:
    10674871
  • 财政年份:
    2022
  • 资助金额:
    $ 113.32万
  • 项目类别:
Delineating the network effects of mental disorder-associated variants using convex optimization methods
使用凸优化方法描述精神障碍相关变异的网络效应
  • 批准号:
    10504516
  • 财政年份:
    2022
  • 资助金额:
    $ 113.32万
  • 项目类别:
A CRISPR/Cas13 approach for identifying individual transcript isoform function in cancer
用于识别癌症中个体转录亚型功能的 CRISPR/Cas13 方法
  • 批准号:
    10671680
  • 财政年份:
    2022
  • 资助金额:
    $ 113.32万
  • 项目类别:
Learning the Regulatory Code of Alzheimer's Disease Genomes
学习阿尔茨海默病基因组的调控密码
  • 批准号:
    10045386
  • 财政年份:
    2020
  • 资助金额:
    $ 113.32万
  • 项目类别:
Learning the Regulatory Code of Alzheimer's Disease Genomes
学习阿尔茨海默病基因组的调控密码
  • 批准号:
    10406760
  • 财政年份:
    2020
  • 资助金额:
    $ 113.32万
  • 项目类别:
Learning the Regulatory Code of Alzheimer's Disease Genomes
学习阿尔茨海默病基因组的调控密码
  • 批准号:
    10686319
  • 财政年份:
    2020
  • 资助金额:
    $ 113.32万
  • 项目类别:
Learning the Regulatory Code of Alzheimer's Disease Genomes
学习阿尔茨海默病基因组的调控密码
  • 批准号:
    10247588
  • 财政年份:
    2020
  • 资助金额:
    $ 113.32万
  • 项目类别:

相似国自然基金

时空序列驱动的神经形态视觉目标识别算法研究
  • 批准号:
    61906126
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
本体驱动的地址数据空间语义建模与地址匹配方法
  • 批准号:
    41901325
  • 批准年份:
    2019
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
  • 批准号:
    61802133
  • 批准年份:
    2018
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
针对内存攻击对象的内存安全防御技术研究
  • 批准号:
    61802432
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
  • 批准号:
    61872252
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Research Project 2
研究项目2
  • 批准号:
    10403256
  • 财政年份:
    2023
  • 资助金额:
    $ 113.32万
  • 项目类别:
Elucidating the Role of YAP and TAZ in the Aging Human Ovary
阐明 YAP 和 TAZ 在人类卵巢衰老中的作用
  • 批准号:
    10722368
  • 财政年份:
    2023
  • 资助金额:
    $ 113.32万
  • 项目类别:
Multi-omic phenotyping of human transcriptional regulators
人类转录调节因子的多组学表型分析
  • 批准号:
    10733155
  • 财政年份:
    2023
  • 资助金额:
    $ 113.32万
  • 项目类别:
Gene regulatory networks in early lung epithelial cell fate decisions
早期肺上皮细胞命运决定中的基因调控网络
  • 批准号:
    10587615
  • 财政年份:
    2023
  • 资助金额:
    $ 113.32万
  • 项目类别:
Defining mechanisms of metabolic-epigenetic crosstalk that drive glioma initiation
定义驱动神经胶质瘤发生的代谢-表观遗传串扰机制
  • 批准号:
    10581192
  • 财政年份:
    2023
  • 资助金额:
    $ 113.32万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了