Knockoff Feature Selection Techniques for Robust Inference in Supervised and Unsupervised Learning
监督和无监督学习中鲁棒推理的仿冒特征选择技术
基本信息
- 批准号:2310955
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-08-01 至 2026-07-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project aims to develop a new methodology for selecting key features among a large pool of potential variables that are predictive of the final outcomes. When applied to the biomedical field, these methods will enable the discovery of determinants of patient health, thus improving the prevention, treatment, and management of diseases. When used in fields such as engineering, psychology, sociology, economics, and environmental sciences, these methods can improve manufacturing processes, social programs that focus on diversity and equity, the care and management of mental health, and the preservation of the environment and natural resources. Additionally, the new methods will also help to generate high-quality synthetic data while maintaining the confidentiality of the original information, thereby spurring new scientific discoveries and providing a valuable educational tool. The project will offer a number of unique interdisciplinary training initiatives for the future cohorts of data scientists at the interface of statistics, machine learning, and biomedical sciences.The research agenda is based on the 'knockoff method' for identifying key features predictive of the outcomes while maintaining false discovery control. The methods incorporate the microbiome phylogenetic structure in feature selection, accommodate missing values, incorporate multiple knockoffs to increase robustness, employ nonparametric Bayesian models for complex data structures, and introduce a new knockoff statistic based on conditional prediction function. The proposed statistics can be paired with state-of-the-art machine learning models to detect nonlinear relationships while accounting for feature correlation. Furthermore, by applying knockoff filtering with unsupervised learning models, this research can identify determinants of the feature space and provide insights into unsupervised clustering and learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在开发一种新的方法,用于在预测最终结果的大量潜在变量中选择关键特征。当应用于生物医学领域时,这些方法将能够发现患者健康的决定因素,从而改善疾病的预防、治疗和管理。当这些方法应用于工程、心理学、社会学、经济学和环境科学等领域时,可以改善制造流程、注重多样性和公平的社会计划、心理健康的护理和管理以及环境和自然的保护。资源。此外,新方法还将有助于生成高质量的合成数据,同时保持原始信息的机密性,从而激发新的科学发现并提供有价值的教育工具。该项目将为未来的数据科学家群体在统计学、机器学习和生物医学科学领域提供许多独特的跨学科培训计划。研究议程基于“仿制品方法”,用于识别预测结果的关键特征同时保持错误发现控制。这些方法将微生物组系统发育结构纳入特征选择中,容纳缺失值,合并多个仿制品以提高鲁棒性,对复杂数据结构采用非参数贝叶斯模型,并引入基于条件预测函数的新仿制品统计量。所提出的统计数据可以与最先进的机器学习模型配对,以检测非线性关系,同时考虑特征相关性。此外,通过将仿冒过滤与无监督学习模型相结合,这项研究可以识别特征空间的决定因素,并提供对无监督聚类和学习的见解。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和知识进行评估,被认为值得支持。更广泛的影响审查标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yushu Shi其他文献
Combined Beta Metric for Unsupervised Clustering of Microbiome Data
用于微生物组数据无监督聚类的组合 Beta 度量
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Yushu Shi;Liangliang Zhang;Christine B. Peterson;K. Do;R. Jenq - 通讯作者:
R. Jenq
Suggestions on Using Machine Learning Models and Cautions for Analyzing Censored Time-To-Event Outcomes.
关于使用机器学习模型的建议和分析审查的事件时间结果的注意事项。
- DOI:
10.1200/po.24.00220 - 发表时间:
2024 - 期刊:
- 影响因子:4.6
- 作者:
Yushu Shi;M. Horiguchi;Ying Lu - 通讯作者:
Ying Lu
Clinical observation of treatment of hypertension with calcium.
钙剂治疗高血压临床观察.
- DOI:
- 发表时间:
1994 - 期刊:
- 影响因子:3.2
- 作者:
Changyu Zhou;Songlan Fan;Lijuan Zhou;Yawping Ni;Tigang Huang;Yushu Shi - 通讯作者:
Yushu Shi
Clinical Observation of 242 Cases of Polycystic Ovary Syndrome
多囊卵巢综合征242例临床观察
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Yushu Shi;Cunjian Yi - 通讯作者:
Cunjian Yi
A dependent Dirichlet process model for survival data with competing risks
具有竞争风险的生存数据的依赖狄利克雷过程模型
- DOI:
10.1007/s10985-020-09506-0 - 发表时间:
2020 - 期刊:
- 影响因子:1.3
- 作者:
Yushu Shi;Purushottam W. Laud;J. Neuner - 通讯作者:
J. Neuner
Yushu Shi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
基于杂交育种协同进化蚁群算法的工业大数据特征选择研究
- 批准号:62376089
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
4-8岁儿童基于道德特征的选择性共情:发展及其机制
- 批准号:32371111
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
数量选择性神经元群的物理-知觉特征编码机制及其与认知行为的关系
- 批准号:32300872
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向复杂医学数据的数据采样和特征选择算法研究
- 批准号:62303167
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
融合模糊粗糙集和稀疏图学习的特征选择方法研究
- 批准号:62376230
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Development of Integrated Quantum Inspired Algorithms for Shapley Value based Fast and Interpretable Feature Subset Selection
基于 Shapley 值的快速且可解释的特征子集选择的集成量子启发算法的开发
- 批准号:
24K15089 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
PTSD and Autoimmune Disease: Towards Causal Effects, Risk Factors, and Mitigators
创伤后应激障碍 (PTSD) 和自身免疫性疾病:因果效应、危险因素和缓解措施
- 批准号:
10696671 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
An active learning framework for adaptive autism healthcare
适应性自闭症医疗保健的主动学习框架
- 批准号:
10716509 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Digital monitoring of autonomic activity to detect empathy loss in behavioral variant frontotemporal dementia
对自主活动进行数字监测以检测行为变异型额颞叶痴呆的同理心丧失
- 批准号:
10722938 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Determining the ototoxic potential of COVID-19 therapeutics using machine learning and in vivo approaches
使用机器学习和体内方法确定 COVID-19 疗法的耳毒性潜力
- 批准号:
10732745 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别: