Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
基本信息
- 批准号:2310262
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-10-01 至 2027-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Generalization of Deep Neural Networks (DNNs) has become a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances in the input. A major reason for this challenge is shortcut learning, which refer to decisions based on relationships in the data that exist, but which are not causal. These decisions fail when the model is transferred to real-world scenarios because of spurious correlations. This project is to investigate shortcut identification and mitigation in deep learning. The successful outcome of this research will lead to advances in providing theoretical understandings, and developing robust and generalizable DNN algorithms to analyze datasets with various types of shortcuts. The education program that integrates machine learning, industrial engineering, and health informatics is to train students with essential data analytics tools in information systems, to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate the generalization of deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems. Specifically, this project studies shortcut identification and detection at different levels, including instance-, feature-, and task-levels, and then performs shortcut mitigation through data augmentation and training regularization. This project also demonstrates how the proposed research innovations could be embedded in two DNN based real medical informatics systems. The proposed frameworks uncover the intrinsic properties of shortcut learning by calibrating shortcut features from different categories of distribution shift, and enable their comprehension and adoption for researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络(DNN)的泛化已成为一个具有挑战性的问题。当数据分布发生变化或输入存在微小干扰时,许多 DNN 就无法保持预测性。这一挑战的一个主要原因是捷径学习,它是指基于数据中存在的关系做出的决策,但这些关系不是因果关系。当模型转移到现实场景时,由于虚假相关性,这些决策会失败。该项目旨在研究深度学习中的捷径识别和缓解。这项研究的成功成果将在提供理论理解和开发强大且可推广的 DNN 算法来分析具有各种类型的快捷方式的数据集方面取得进展。该教育计划整合了机器学习、工业工程和健康信息学,旨在培训学生掌握信息系统中必要的数据分析工具,以吸引、指导和留住代表性不足群体的成员。该项目的主要目标是系统地调查识别从以数据为中心的角度减轻快捷特征,以促进深度学习的泛化。开发的以数据为中心的机制可以直接应用于现实世界的数据分析系统。具体来说,该项目研究不同级别(包括实例级别、特征级别和任务级别)的快捷方式识别和检测,然后通过数据增强和训练正则化来执行快捷方式缓解。该项目还展示了如何将所提出的研究创新嵌入到两个基于 DNN 的真实医学信息系统中。所提出的框架通过校准不同类别的分布变化的快捷特征,揭示了快捷学习的内在属性,并使研究人员和从业者能够理解和采用它们。该奖项反映了 NSF 的法定使命,并通过使用基金会的评估进行评估,被认为值得支持。智力价值和更广泛的影响审查标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Na Zou其他文献
Retiring $Δ$DP: New Distribution-Level Metrics for Demographic Parity
退休 $Δ$DP:人口平等的新分配水平指标
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Xiaotian Han;Zhimeng Jiang;Hongye Jin;Zirui Liu;Na Zou;Qifan Wang;Xia Hu - 通讯作者:
Xia Hu
PolyJet 3D Printing: Predicting Color by Multilayer Perceptron Neural Network
PolyJet 3D 打印:通过多层感知器神经网络预测颜色
- DOI:
10.1016/j.stlm.2022.100049 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Xingjian Wei;Na Zou;Li Zeng;Zhijian Pei - 通讯作者:
Zhijian Pei
A Data Adaptive Biological Sequence Representation for Supervised Learning
用于监督学习的数据自适应生物序列表示
- DOI:
10.1007/s41666-018-0038-5 - 发表时间:
2018 - 期刊:
- 影响因子:5.9
- 作者:
Hande Cakin;Berk Gorgulu;M. Baydogan;Na Zou;Jing Li - 通讯作者:
Jing Li
Identification of the hybrids between Lilium brownii and L. davidii using fluorescence in situ hybridization (FISH)
使用荧光原位杂交 (FISH) 鉴定布朗百合和戴维百合之间的杂交种
- DOI:
10.17660/actahortic.2019.1237.13 - 发表时间:
2019-04 - 期刊:
- 影响因子:0
- 作者:
Like Wu;Wei Zheng;Kongzhong Xiao;Jie Zeng;Luomin Cui;Hui Li;Yanmei Liu;Na Zou;Junhuo Cai;Shujun Zhou - 通讯作者:
Shujun Zhou
Towards Assumption-free Bias Mitigation
迈向无假设偏见缓解
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Chia;Yu;Kwei;Xiaotian Han;Xia Hu;Na Zou - 通讯作者:
Na Zou
Na Zou的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Na Zou', 18)}}的其他基金
CAREER: Exploring and Exploiting Data-Centric Modeling for Fairness in Machine Learning
职业:探索和利用以数据为中心的建模以实现机器学习的公平性
- 批准号:
2239257 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
III: Medium: Collaborative Research: Towards Effective Interpretation of Deep Learning: Prediction, Representation, Modeling and Utilization
III:媒介:协作研究:走向深度学习的有效解释:预测、表示、建模和利用
- 批准号:
1900990 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
相似国自然基金
USP46通过去泛素化修饰RAP80促进同源重组修复的分子机制及其在三阴乳腺癌中的功能研究
- 批准号:82373150
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
基于国人脊柱矢状位序列新分型的腰椎-躯干三维运动研究
- 批准号:82302739
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高寒草灌植被冠层与根系结构对三维土壤水分动态的影响研究
- 批准号:42301019
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
三维有序大/介孔稀土氧化物(La2O3和CeO2)负载Ru催化剂用于氨分解性能研究
- 批准号:52361040
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
人机物三元融合环境下的人机合作关键问题研究
- 批准号:62376117
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342498 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342497 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
- 批准号:
2420691 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant