Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets

可解释的机器学习识别阿尔茨海默病的治疗目标

基本信息

  • 批准号:
    10347341
  • 负责人:
  • 金额:
    $ 58.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-02-15 至 2023-12-21
  • 项目状态:
    已结题

项目摘要

Project Summary Alzheimer’s disease (AD) is an urgent national and international research priority. Amyloid plaques and neurofibrillary tangles are the hallmark of AD. Their building blocks are Amyloid-β (Aβ) and tau, respectively. At present, we lack an understanding of the set of genes that affect formation of plaques and tangles along with protective and pathological responses to these toxic peptides. Biologists are now gathering gene expression data and Aβ and tau measures from human brain tissues. The current approach attempts to find a set of features (here, gene expression levels) that best predict an outcome (Aβ or tau level). The identified features, biomarkers, can help determine the molecular basis for plaques and tangles. Unfortunately, false positive biomarkers are very common, as evidenced by low success rates of replication in independent data and low success reaching clinical practice (less than 1%). We seek to radically shift the current paradigm in biomarker discovery by resolving three fundamental problems with the current approach using novel, theoretically well-founded machine learning (ML) methods to learn interpretable models from data. Aim 1. Learn an interpretable feature representation from publicly available, high-throughput brain data. High-dimensionality, hidden variables, and complex feature correlations create a discrepancy between predictability (i.e., observed statistical associations) and true biological interactions. To increase the chance to identify true positive biomarkers, we need new feature selection criteria to learn a model that better explains rather than simply predicts the outcome. To do so, our proposed ML algorithms will identify the genes that are likely to give a meaningful explanation of the outcome (Aβ or tau level) by inferring both the functions of genes in the cellular processes contributing to AD and the gene interaction network from many existing brain datasets. Aim 2. Make interpretable predictions using a unified framework to explain model predictions. Due to disease heterogeneity, complex models (e.g., deep learning or ensemble models) often more accurately describe relationships between genes and an outcome than simpler, linear models, but lack interpretability. We will develop a novel ML framework that interprets complex model predictions by estimating the importance of each feature to a specific prediction, which will identify features of high importance for each individual as personalized markers and classify subjects based on these importance estimates. Aim 3. Validate the identified candidate biomarkers using powerful worm models of AD. Analyzing observational data without doing interventional experiments cannot prove causal relationships. In collaboration with co-I Matt Kaeberlein, we will utilize powerful nematode models of AD to test our hypotheses on the role of certain genes as disease modifiers, and develop a new way to refine the models based on this knowledge. Successful completion of this project will result in previously unknown molecular basis for Aβ and tau levels, potential therapeutic targets, and general ML techniques widely applicable to many other data science problems.
项目概要 阿尔茨海默氏病(AD)是淀粉样斑块和淀粉样蛋白斑块的紧迫研究重点。 神经原纤维缠结是 AD 的标志,它们的组成部分分别是淀粉样蛋白 (Aβ) 和 tau。 目前,我们对影响斑块和缠结形成以及影响斑块和缠结形成的基因组缺乏了解。 对这些有毒肽的保护性和病理性反应。 生物学家现在正在收集人类脑组织的基因表达数据以及 Aβ 和 tau 蛋白测量值。 当前的方法试图找到一组最能预测结果的特征(此处为基因表达水平)(Aβ 或 tau 水平)。所识别的特征、生物标志物可以帮助确定斑块和缠结的分子基础。 不幸的是,假阳性生物标志物非常常见,复制成功率低就证明了这一点。 独立数据和临床实践的成功率较低(低于 1%)。 通过使用新颖的方法解决当前方法的三个基本问题,生物标志物发现的范例 理论上有充分依据的机器学习(ML)方法,用于从数据中学习可解释的模型。 目标 1. 从公开的、高通量的大脑数据中学习可解释的特征表示。 高维、隐藏变量和复杂的特征相关性造成了两者之间的差异 可预测性(即观察到的统计关联)和真实的生物相互作用。 识别真正的阳性生物标志物,我们需要新的特征选择标准来学习更好地解释的模型 为此,我们提出的机器学习算法将识别基因,而不是简单地预测结果。 通过推断基因的功能,可能对结果(Aβ 或 tau 水平)给出有意义的解释 来自许多现有大脑数据集的 AD 细胞过程和基因相互作用网络。 目标 2. 使用统一的框架来解释模型预测,从而做出可解释的预测。 疾病异质性,复杂模型(例如深度学习或集成模型)通常可以更准确地描述 基因和结果之间的关系比简单的线性模型更简单,但缺乏可解释性。 开发一种新颖的机器学习框架,通过估计每个模型的重要性来解释复杂的模型预测 特征到特定的预测,这将识别对每个人来说高度重要的特征作为个性化 标记并根据这些重要性估计对主题进行分类。 目标 3. 使用强大的 AD 蠕虫模型分析来验证已识别的候选生物标志物。 不进行介入实验的观察数据无法证明合作中的因果关系。 与合作者 Matt Kaeberlein 一起,我们将利用强大的 AD 线虫模型来检验我们对该作用的假设 某些基因作为疾病调节剂,并开发一种新的方法来基于这些知识来完善模型。 该项目的成功完成将带来以前未知的 Aβ 和 tau 水平的分子基础, 潜在的治疗目标,以及广泛适用于许多其他数据科学问题的通用机器学习技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Su-In Lee其他文献

Su-In Lee的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Su-In Lee', 18)}}的其他基金

Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets
可解释的机器学习识别阿尔茨海默病的治疗目标
  • 批准号:
    10132962
  • 财政年份:
    2019
  • 资助金额:
    $ 58.2万
  • 项目类别:
Interpretable Machine Learning to Identify Alzheimer's Disease Therapeutic Targets
可解释的机器学习识别阿尔茨海默病的治疗目标
  • 批准号:
    10613437
  • 财政年份:
    2019
  • 资助金额:
    $ 58.2万
  • 项目类别:
Application of Data Sciences in Traumatic Brain Injury
数据科学在脑外伤中的应用
  • 批准号:
    9685513
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10224845
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10020414
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Opening the Black Box of Machine Learning Models
打开机器学习模型的黑匣子
  • 批准号:
    10437684
  • 财政年份:
    2018
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10042623
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10670111
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10260483
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:
Core F: Artificial Intelligence and Bioinformatics
核心F:人工智能和生物信息学
  • 批准号:
    10438909
  • 财政年份:
    1997
  • 资助金额:
    $ 58.2万
  • 项目类别:

相似国自然基金

算法鸿沟影响因素与作用机制研究
  • 批准号:
    72304017
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
算法规范对知识型零工在客户沟通中情感表达的动态影响调查:规范焦点理论视角
  • 批准号:
    72302005
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于先进算法和行为分析的江南传统村落微气候的评价方法、影响机理及优化策略研究
  • 批准号:
    52378011
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
  • 批准号:
    72372021
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
算法人力资源管理对员工算法应对行为和工作绩效的影响:基于员工认知与情感的路径研究
  • 批准号:
    72372070
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目

相似海外基金

Social media as a social mechanism of non-cigarette tobacco use: Engaging young adults to examine tobacco culture online
社交媒体作为非卷烟烟草使用的社会机制:让年轻人在线审视烟草文化
  • 批准号:
    10667700
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
Bayesian approaches to identify persons with osteoarthritis in electronic health records and administrative health data in the absence of a perfect reference standard
在缺乏完美参考标准的情况下,贝叶斯方法在电子健康记录和管理健康数据中识别骨关节炎患者
  • 批准号:
    10665905
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
MASS: Muscle and disease in postmenopausal women
MASS:绝经后妇女的肌肉和疾病
  • 批准号:
    10736293
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
In vivo Evaluation of Lymph Nodes Using Quantitative Ultrasound
使用定量超声对淋巴结进行体内评估
  • 批准号:
    10737152
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
Noninvasive prediction of skin precancer severity using in vivo cellular imaging and deep learning algorithms.
使用体内细胞成像和深度学习算法无创预测皮肤癌前病变的严重程度。
  • 批准号:
    10761578
  • 财政年份:
    2023
  • 资助金额:
    $ 58.2万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了