Collaborative Research: Biology-guided neural networks for discovering phenotypic traits

合作研究:生物学引导的神经网络发现表型特征

基本信息

项目摘要

Unlike genetic data, the traits of organisms such as their visible features, are not available in databases for analysis. The lack of machine-readable trait data has slowed progress on four grand challenge problems in biology: predicting the genes that generate traits, understanding the patterns of evolution, predicting the effects of ecological change, and species identification. This project will use advances in machine learning and machine-readable biological knowledge to create a new method to automatically identify traits from images of organisms. Images of organisms are widely available, and this new method could be used to rapidly harvest traits that could be used to solve the grand challenges in biology. Large image collections and corresponding digital data from fishes will be used in this study because of the extensive resources available for these organisms. The new machine learning model can be generalized to other disciplines that have similar machine-readable knowledge, and it will help in explaining the results of artificial intelligence, thus advancing the field of computer science. The new method stands to benefit society in application to areas such as agriculture or medicine, where trait discovery from images is critical in disease diagnosis. The project will support the education of students and postdocs in biology, computer science, and information science. It will disseminate its findings through workshops, presentations, publications, and open access to data and code that it produces. This project will leverage advances in state-of-the-art machine learning to develop a novel class of artificial neural networks that can exploit the machine readable and predictive knowledge about biology that is available in the form of phylogenies and anatomy ontologies. These biology-guided neural networks are expected to automatically detect and predict traits from specimen images, with little training data. Image-based trait data derived from this work will enable progress in gene-phenotype mapping to novel traits and understanding patterns of evolution. The resulting machine learning model can be generalized to other disciplines that have formally structured knowledge, and will contribute to advances in computer science by going beyond black-box learning and making important advances toward Explainable Artificial Intelligence. It may be extended to applied areas, such as agriculture or the biomedical domain. The research will be piloted using teleost fishes because of many high-quality data resources (digital images, evolutionary trees, anatomy ontology). Methods for automated metadata quality assessment and provenance tracking will be developed in the course of this project to ensure the results and processes are verifiable, replicable and reusable. These will broadly impact the many domains that will adopt machine learning as a way to make discoveries from images. This convergent research will accelerate scientific discovery across the biological sciences and computer science by harnessing the data revolution in conjunction with biological knowledge.This project is part of the National Science Foundation's Harnessing the Data Revolution (HDR) Big Idea activity, and is jointly supported by the HDR and the Division of Biological Infrastructure within the NSF Directorate of Directorate for Biological Sciences.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
与遗传数据不同,生物体的特征(例如其可见特征)无法在数据库中进行分析。 机器可读性状数据的缺乏减缓了生物学中四大挑战问题的进展:预测产生性状的基因、理解进化模式、预测生态变化的影响以及物种鉴定。该项目将利用机器学习和机器可读生物学知识的进步来创建一种新方法,自动从生物体图像中识别特征。 生物体图像随处可见,这种新方法可用于快速收获特征,从而解决生物学中的重大挑战。 由于鱼类有大量可用资源,因此本研究将使用来自鱼类的大型图像集和相应的数字数据。新的机器学习模型可以推广到具有类似机器可读知识的其他学科,这将有助于解释人工智能的结果,从而推动计算机科学领域的发展。 这种新方法在农业或医学等领域的应用将使社会受益,在这些领域,从图像中发现特征对于疾病诊断至关重要。 该项目将支持生物学、计算机科学和信息科学领域的学生和博士后教育。 它将通过研讨会、演示、出版物以及开放获取其生成的数据和代码来传播其研究结果。该项目将利用最先进的机器学习的进步来开发一类新型的人工神经网络,该网络可以利用以系统发育和解剖学本体形式提供的机器可读和预测性生物学知识。 这些生物学引导的神经网络有望在几乎不需要训练数据的情况下自动检测和预测样本图像的特征。这项工作得出的基于图像的性状数据将使基因表型映射到新性状和理解进化模式方面取得进展。由此产生的机器学习模型可以推广到具有正式结构化知识的其他学科,并将通过超越黑盒学习并在可解释的人工智能方面取得重要进展,为计算机科学的进步做出贡献。 它可以扩展到应用领域,例如农业或生物医学领域。由于拥有许多高质量的数据资源(数字图像、进化树、解剖本体),该研究将使用硬骨鱼进行试点。该项目过程中将开发自动化元数据质量评估和来源跟踪的方法,以确保结果和流程可验证、可复制和可重用。 这些将广泛影响许多采用机器学习作为从图像中进行发现的方式的领域。这项融合研究将通过结合生物知识利用数据革命,加速生物科学和计算机科学领域的科学发现。该项目是美国国家科学基金会利用数据革命 (HDR) 大创意活动的一部分,并得到以下机构的共同支持:该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Discovering Novel Biological Traits From Images Using Phylogeny-Guided Neural Networks
使用系统发育引导神经网络从图像中发现新的生物特征
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Anuj Karpatne其他文献

Anuj Karpatne的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Anuj Karpatne', 18)}}的其他基金

CAREER: Unifying Scientific Knowledge with Machine Learning for Forward, Inverse, and Hybrid Modeling of Scientific Systems
职业:将科学知识与机器学习相结合,对科学系统进行正向、逆向和混合建模
  • 批准号:
    2239328
  • 财政年份:
    2023
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Continuing Grant
Collaborative Research: MRA: Advancing process understanding of lake water quality to macrosystem scales with knowledge-guided machine learning
合作研究:MRA:通过知识引导的机器学习将湖泊水质的过程理解推进到宏观系统尺度
  • 批准号:
    2213550
  • 财政年份:
    2022
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant
III:Medium:Physics-guided Machine Learning for Predicting Cell Trajectories, Shapes, and Interactions in Complex Dynamic Environments
III:中:物理引导机器学习,用于预测复杂动态环境中的细胞轨迹、形状和相互作用
  • 批准号:
    2107332
  • 财政年份:
    2021
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant
EAGER: Collaborative Research:III: Exploring Physics Guided Machine Learning for Accelerating Sensing and Physical Sciences
EAGER:协作研究:III:探索物理引导机器学习以加速传感和物理科学
  • 批准号:
    2026710
  • 财政年份:
    2020
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant

相似国自然基金

脉络膜黑色素瘤循环血内肿瘤细胞的捕获、扩增、生物学特征分析与外泌体载药模型构建的研究
  • 批准号:
    82303540
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
癌-睾丸蛋白PIWIL4在非小细胞肺癌中参与小RNA生成的机制和生物学功能研究
  • 批准号:
    32371347
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于飞秒激光的牙预备体智能一体化精准制备及生物学效应的研究
  • 批准号:
    82371019
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
增材制造锌镁合金复合椎间融合器降解调控机制与生物学效应研究
  • 批准号:
    52301302
  • 批准年份:
    2023
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目
铁锰氧化物驱动的甲烷厌氧氧化生物学机制及对人工湿地甲烷减排研究
  • 批准号:
    52370117
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: REU Site: Summer Undergraduate Research Program in RNA and Genome Biology (REU-RGB)
合作研究:REU 网站:RNA 和基因组生物学暑期本科生研究计划 (REU-RGB)
  • 批准号:
    2349255
  • 财政年份:
    2024
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Continuing Grant
Collaborative Research: IMPLEMENTATION: Broadening participation of marginalized individuals to transform SABER and biology education
合作研究:实施:扩大边缘化个人的参与,以改变 SABER 和生物教育
  • 批准号:
    2334952
  • 财政年份:
    2024
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant
Collaborative Research: IMPLEMENTATION: Broadening participation of marginalized individuals to transform SABER and biology education
合作研究:实施:扩大边缘化个人的参与,以改变 SABER 和生物教育
  • 批准号:
    2334953
  • 财政年份:
    2024
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant
Collaborative Research: IMPLEMENTATION: Broadening participation of marginalized individuals to transform SABER and biology education
合作研究:实施:扩大边缘化个人的参与,以改变 SABER 和生物教育
  • 批准号:
    2334955
  • 财政年份:
    2024
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Standard Grant
Collaborative Research: REU Site: Summer Undergraduate Research Program in RNA and Genome Biology (REU-RGB)
合作研究:REU 网站:RNA 和基因组生物学暑期本科生研究计划 (REU-RGB)
  • 批准号:
    2349254
  • 财政年份:
    2024
  • 资助金额:
    $ 42.2万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了