Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework

协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架

基本信息

  • 批准号:
    2310260
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-10-01 至 2027-09-30
  • 项目状态:
    未结题

项目摘要

Deep Neural Network (DNN) generalization is a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances to their input. A common reason for this behavior is “shortcut learning”, in which the DNN learns to make decisions based on relationships observed in the data, but that are not causal. These decisions fail when the model is transferred to real-world scenarios because the network has latched onto spurious correlations. This project investigates how to identify and mitigate shortcut learning in DNNs. A successful outcome of this research will lead to advances in theoretical understanding, as well as robust and generalizable DNN algorithms that avoid shortcuts. The education program integrates machine learning, industrial engineering, and health informatics to train students with essential data analytics tools in information systems, as well as to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate generalization in deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems to mitigate the drawbacks of shortcut learning. The project studies shortcut identification and detection at different levels, including instance, feature, and task levels, and then performs shortcut mitigation through data augmentation and training regularization. The project also demonstrates how the proposed research innovations could be embedded into two real DNN-based medical informatics systems. The proposed framework uncovers intrinsic properties of shortcut learning by calibrating shortcut features across different types of distribution shifts, and should support both researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络 (DNN) 泛化是一个具有挑战性的问题,当数据分布发生变化或输入存在微小干扰时,许多 DNN 无法保持预测性,这种行为的常见原因是“捷径学习”,即 DNN 进行学习。根据数据中观察到的关系做出决策,但当模型转移到现实场景时,这些决策会失败,因为网络已经锁定了虚假相关性。这项研究的成功成果将带来理论理解的进步,以及避免走捷径的强大且可推广的 DNN 算法。该教育计划整合了机器学习、工业工程和健康信息学,以培训学生使用基本的数据分析工具。该项目的主要目标是从以数据为中心的角度系统地研究捷径特征的识别和缓解,以促进深度学习中所开发数据的泛化。以中心机制可以直接在现实世界的数据分析系统中采用,以减轻捷径学习的缺点。该项目研究不同级别(包括实例、特征和任务级别)的捷径识别和检测,然后通过数据增强和训练正则化来执行捷径缓解。该项目还展示了如何将所提出的研究创新嵌入到两个真实的基于 DNN 的医学信息学系统中,所提出的框架通过校准不同类型的分布变化的快捷特征来揭示快捷学习的内在属性,并且应该为研究人员和从业者提供支持。这授予 NSF 的法定使命,并通过评估反映使用基金会的智力优点和更广泛的影响审查标准,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xia Hu其他文献

Phloretin exhibits potential food-drug interactions by inhibiting human UDP-glucuronosyltransferases in vitro.
根皮素通过在体外抑制人 UDP-葡萄糖醛酸基转移酶而表现出潜在的食物-药物相互作用。
Towards Fairness-Aware Disaster Informatics: an Interdisciplinary Perspective
迈向具有公平意识的灾害信息学:跨学科视角
  • DOI:
    10.1109/access.2020.3035714
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Yang Yang;Cheng Zhang;Chao Fan;A. Mostafavi;Xia Hu
  • 通讯作者:
    Xia Hu
Applying queueing theory to the study of emergency department operations: a survey and a discussion of comparable simulation studies
将排队理论应用于急诊科操作研究:可比模拟研究的调查和讨论
  • DOI:
    10.1111/itor.12400
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xia Hu;S. Barnes;B. Golden
  • 通讯作者:
    B. Golden
Rubidium isotope compositions of the average upper continental crust and the Himalayan leucogranites: implications for magmatic-fluid interaction
平均上大陆壳和喜马拉雅淡色花岗岩的铷同位素组成:对岩浆-流体相互作用的影响
  • DOI:
    10.1016/j.gca.2022.09.015
  • 发表时间:
    2022-09-01
  • 期刊:
  • 影响因子:
    5
  • 作者:
    Xia Hu;X. Nan;Xiaochi Liu;F. Huang
  • 通讯作者:
    F. Huang
FMP: Toward Fair Graph Message Passing against Topology Bias
FMP:针对拓扑偏差实现公平图消息传递
  • DOI:
  • 发表时间:
    2022-02-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhimeng Jiang;Xiaotian Han;Chao Fan;Zirui Liu;Na Zou;A. Mostafavi;Xia Hu
  • 通讯作者:
    Xia Hu

Xia Hu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xia Hu', 18)}}的其他基金

CAREER: Human-Centric Big Network Embedding
职业:以人为本的大网络嵌入
  • 批准号:
    2224843
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
CAREER: Human-Centric Big Network Embedding
职业:以人为本的大网络嵌入
  • 批准号:
    1750074
  • 财政年份:
    2018
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: A General Feature Learning Framework for Dynamic Attributed Networks
III:小:协作研究:动态属性网络的通用特征学习框架
  • 批准号:
    1718840
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CRII: III: Novel Embedding Algorithms for Large-Scale and Complex Attributed Networks
CRII:III:大规模和复杂属性网络的新颖嵌入算法
  • 批准号:
    1657196
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant

相似国自然基金

睡眠剥夺通过上调BMAL1/IL-17轴促进三级淋巴结构形成加重哮喘的研究
  • 批准号:
    82300039
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
富醌生物炭促进三价铁还原强化人工湿地总氮去除作用机制及调控策略研究
  • 批准号:
    52300213
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
三维拓扑结构支架在定向引导神经干细胞修复耳蜗螺旋神经节中的作用及机制研究
  • 批准号:
    82301331
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于三维流体微环境控制与原位表征的人工微血管组织构建方法研究
  • 批准号:
    62373235
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342497
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了