Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework

协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架

基本信息

  • 批准号:
    2310262
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-10-01 至 2027-09-30
  • 项目状态:
    未结题

项目摘要

Generalization of Deep Neural Networks (DNNs) has become a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances in the input. A major reason for this challenge is shortcut learning, which refer to decisions based on relationships in the data that exist, but which are not causal. These decisions fail when the model is transferred to real-world scenarios because of spurious correlations. This project is to investigate shortcut identification and mitigation in deep learning. The successful outcome of this research will lead to advances in providing theoretical understandings, and developing robust and generalizable DNN algorithms to analyze datasets with various types of shortcuts. The education program that integrates machine learning, industrial engineering, and health informatics is to train students with essential data analytics tools in information systems, to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate the generalization of deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems. Specifically, this project studies shortcut identification and detection at different levels, including instance-, feature-, and task-levels, and then performs shortcut mitigation through data augmentation and training regularization. This project also demonstrates how the proposed research innovations could be embedded in two DNN based real medical informatics systems. The proposed frameworks uncover the intrinsic properties of shortcut learning by calibrating shortcut features from different categories of distribution shift, and enable their comprehension and adoption for researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络(DNN)的泛化已成为一个具有挑战性的问题。当数据分布发生变化或输入存在微小干扰时,许多 DNN 无法保持预测性。这一挑战的一个主要原因是捷径学习,它是指基于数据中存在的关系做出的决策,但这些关系不是因果关系。当模型转移到现实场景时,由于虚假相关性,这些决策会失败。该项目旨在研究深度学习中的捷径识别和缓解。这项研究的成功成果将在提供理论理解和开发强大且可推广的 DNN 算法来分析具有各种类型的快捷方式的数据集方面取得进展。该教育计划整合了机器学习、工业工程和健康信息学,旨在培训学生掌握信息系统中必要的数据分析工具,以吸引、指导和留住代表性不足群体的成员。该项目的主要目标是系统地调查识别从以数据为中心的角度减轻快捷特征,以促进深度学习的泛化。开发的以数据为中心的机制可以直接应用于现实世界的数据分析系统。具体来说,该项目研究不同级别(包括实例级别、特征级别和任务级别)的快捷方式识别和检测,然后通过数据增强和训练正则化来执行快捷方式缓解。该项目还展示了如何将所提出的研究创新嵌入到两个基于 DNN 的真实医学信息系统中。所提出的框架通过校准不同类别的分布变化的快捷特征,揭示了快捷学习的内在属性,并使研究人员和从业者能够理解和采用它们。该奖项反映了 NSF 的法定使命,并通过使用基金会的评估进行评估,被认为值得支持。智力价值和更广泛的影响审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Na Zou其他文献

Multi-task learning with dynamic re-weighting to achieve fairness in healthcare predictive modeling
具有动态重新加权的多任务学习,以实现医疗保健预测模型的公平性
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Can Li;Sirui Ding;Na Zou;Xia Hu;Xiaoqian Jiang;Kai Zhang
  • 通讯作者:
    Kai Zhang
Identify and mitigate bias in electronic phenotyping: A comprehensive study from computational perspective.
识别并减轻电子表型分析中的偏差:从计算角度进行的综合研究。
  • DOI:
    10.1016/j.jbi.2024.104671
  • 发表时间:
    2024-06-01
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Sirui Ding;Shenghan Zhang;Xia Hu;Na Zou
  • 通讯作者:
    Na Zou
Non-local U-Net for Biomedical Image Segmentation
用于生物医学图像分割的非局部 U-Net
Non-Local U-Nets for Biomedical Image Segmentation
用于生物医学图像分割的非局部 U-Net
  • DOI:
    10.1609/aaai.v34i04.6100
  • 发表时间:
    2020-04-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhengyang Wang;Na Zou;D. Shen;Shuiwang Ji
  • 通讯作者:
    Shuiwang Ji
A novel enzymatic biosensor for detection of intracellular hydrogen peroxide based on 1-aminopyrene and reduced graphene oxides
一种基于1-氨基芘和还原氧化石墨烯的新型酶生物传感器,用于检测细胞内过氧化氢
  • DOI:
    10.1007/s12039-019-1604-y
  • 发表时间:
    2019-03-21
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    Na Zou;Xianyong Wei;Z. Zong;Xin Li;Zhaoxia Wang;Xueliang Wang
  • 通讯作者:
    Xueliang Wang

Na Zou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Na Zou', 18)}}的其他基金

CAREER: Exploring and Exploiting Data-Centric Modeling for Fairness in Machine Learning
职业:探索和利用以数据为中心的建模以实现机器学习的公平性
  • 批准号:
    2239257
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: Towards Effective Interpretation of Deep Learning: Prediction, Representation, Modeling and Utilization
III:媒介:协作研究:走向深度学习的有效解释:预测、表示、建模和利用
  • 批准号:
    1900990
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

酸枣仁皂苷A对三叉神经痛中P2X7受体介导的NLRP3/Caspase-1通路的作用研究
  • 批准号:
    82360199
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
三维内转进气道唇口弯曲激波复杂干扰机理研究
  • 批准号:
    12302389
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
芯片级原子钟用高效率双功能准三维亚波长结构器件研究
  • 批准号:
    62305252
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
复杂环境下的水下三维路径规划方法研究
  • 批准号:
    62371405
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
P-S-Se三元共价框架结构设计及在锂硫电池中的无穿梭效应储锂机理研究
  • 批准号:
    22379114
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342497
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了