CAREER: Super-Quantile Based Methods for Analyzing Large-Scale Heterogenous Data
职业:基于超分位数的大规模异构数据分析方法
基本信息
- 批准号:2238428
- 负责人:
- 金额:$ 41.04万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-06-01 至 2028-05-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Data-driven decision-making has become ubiquitous across many scientific disciplines and in every aspect of life. As society relies more heavily on statistical modeling to make decisions, it becomes imperative for statistical methods to be able to model heterogenous data so that different decisions that will lead to better outcomes for different subgroups can be made. This is appealing in the big data era as data-rich settings allow statistical models to be trained to be more flexible and robust to heterogeneous data. This project focuses on developing a new class of statistical methods for modeling large-scale heterogenous data based on the super-quantile (tail average), also referred to as the expected shortfall or conditional value-at-risk. The methods under development will have the potential to answer questions that cannot be directly answered previously using existing tools in different fields such as climate science, neuroscience, finance, and health disparity research. The project will allow undergraduate and graduate students to work on cutting-edge methods for modeling data heterogeneity. In addition, a graduate-level course on data heterogeneity will be developed. The investigator will also engage in K-12 educational outreach in collaboration with the Center for Educational Outreach at the University of Michigan.With the abundance of data, there has been growing interest in modeling large-scale heterogeneous data for decision-making. Quantile regression is one representative statistical tool for modeling heterogeneous data, but one limitation is that it focuses on a specific quantile level and may not be the best approach for answering scientific questions that involve aggregate information of the lower/upper tail of the distribution of interest. The investigator studies the development of a new class of super-quantile-based tools to help practitioners answer such questions. There are three aims in this project: (i) establish theoretical foundations and develop scalable computational algorithms for fitting super-quantile regression in the big-data regime, high-dimensional regime, and data with outliers; (ii) develop super-quantile regression methods in the presence of unmeasured confounders; (iii) develop a series of super-quantile-based methods for analyzing different data types. The investigator will create a comprehensive platform, including software and e-book tutorials, to encourage using super-quantile-based methods.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据驱动的决策已经在许多科学学科和生活的各个方面变得无处不在。 随着社会越来越依赖统计模型来做出决策,统计方法必须能够对异构数据进行建模,以便做出不同的决策,从而为不同的子群体带来更好的结果。 这在大数据时代很有吸引力,因为数据丰富的设置允许训练统计模型,使其对异构数据更加灵活和鲁棒。该项目的重点是开发一类新的统计方法,用于基于超分位数(尾部平均值)(也称为预期缺口或条件风险价值)对大规模异构数据进行建模。正在开发的方法将有可能回答以前使用气候科学、神经科学、金融和健康差异研究等不同领域的现有工具无法直接回答的问题。 该项目将允许本科生和研究生研究数据异构性建模的尖端方法。 此外,还将开发关于数据异构性的研究生课程。 研究人员还将与密歇根大学教育外展中心合作,参与 K-12 教育外展工作。随着数据的丰富,人们对大规模异构数据建模以进行决策的兴趣日益浓厚。 分位数回归是一种用于对异构数据进行建模的代表性统计工具,但一个局限性是它专注于特定的分位数水平,并且可能不是回答涉及感兴趣分布的下/上尾部聚合信息的科学问题的最佳方法。 研究人员研究了一类基于超分位数的新型工具的开发,以帮助从业者回答此类问题。 该项目有三个目标:(i)建立理论基础并开发可扩展的计算算法,用于在大数据体系、高维体系和具有异常值的数据中拟合超分位数回归; (ii) 在存在无法测量的混杂因素的情况下开发超分位数回归方法; (iii) 开发一系列基于超分位数的方法来分析不同的数据类型。研究者将创建一个综合平台,包括软件和电子书教程,以鼓励使用基于超分位数的方法。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查进行评估,被认为值得支持标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kean Ming Tan其他文献
Statistical Inference for Covariate-Adjusted and Interpretable Generalized Factor Model with Application to Testing Fairness
协变量调整和可解释的广义因子模型的统计推断及其在测试公平性中的应用
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Ouyang Jing;Chengyu Cui;Kean Ming Tan;Gongjun Xu - 通讯作者:
Gongjun Xu
Selection Bias Correction and Eect Size Estimation under Dependence
依赖性下的选择偏差校正和效应大小估计
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Kean Ming Tan;N. Simon;D. Witten - 通讯作者:
D. Witten
J ul 2 01 9 Robust convex clustering : How does the fusion penalty enhance robustness ?
Jul 2 01 9 鲁棒凸聚类:融合惩罚如何增强鲁棒性?
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Chenyu Liu;Qiang Sun;Kean Ming Tan - 通讯作者:
Kean Ming Tan
Estimation of complier expected shortfall treatment effects with a binary instrumental variable
使用二元工具变量估计编译者预期缺口治疗效果
- DOI:
10.1016/j.jeconom.2023.105572 - 发表时间:
2023 - 期刊:
- 影响因子:6.3
- 作者:
B. Wei;Kean Ming Tan;Xuming He - 通讯作者:
Xuming He
Supplement to “ Smoothed Quantile Regression with Large-Scale Inference ”
“大规模推理的平滑分位数回归”的补充
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Xuming He;Xiaoou Pan;Kean Ming Tan;Wen - 通讯作者:
Wen
Kean Ming Tan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kean Ming Tan', 18)}}的其他基金
Collaborative Research: Inference and Decentralized Computing for Quantile Regression and Other Non-Smooth Methods
合作研究:分位数回归和其他非平滑方法的推理和分散计算
- 批准号:
2113346 - 财政年份:2021
- 资助金额:
$ 41.04万 - 项目类别:
Standard Grant
Statistical Machine Learning Methods for Complex Data Sets
复杂数据集的统计机器学习方法
- 批准号:
1949730 - 财政年份:2019
- 资助金额:
$ 41.04万 - 项目类别:
Standard Grant
Statistical Machine Learning Methods for Complex Data Sets
复杂数据集的统计机器学习方法
- 批准号:
1811315 - 财政年份:2018
- 资助金额:
$ 41.04万 - 项目类别:
Standard Grant
相似国自然基金
水稻SUPER WOMAN 3 (SPW3) 基因调控花器官发育的分子机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:
基于质谱的Super SILAC结合膜富集技术解析镁离子相关蛋白调控网络在Ⅲ型前列腺炎中的作用机制研究
- 批准号:22164007
- 批准年份:2021
- 资助金额:35 万元
- 项目类别:地区科学基金项目
Triptolide通过调控Super-enhancer抑制抗体产生改善抗体介导的移植肾排斥反应
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
发展双模态超分辨率全景成像技术,描绘自噬和迁移性胞吐过程中的细胞器互作网络
- 批准号:92054301
- 批准年份:2020
- 资助金额:900.0 万元
- 项目类别:重大研究计划
Super-lncRNA与super-enhancer的相互作用在乳腺癌发生发展中作用机制的研究
- 批准号:81902680
- 批准年份:2019
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Super-resolution platform to accelerate biological and molecular research
加速生物和分子研究的超分辨率平台
- 批准号:
LE240100134 - 财政年份:2024
- 资助金额:
$ 41.04万 - 项目类别:
Linkage Infrastructure, Equipment and Facilities
SUPer-REsolution non-invasive Muscle measurements with miniaturised magnetIc SEnsors (SUPREMISE)
使用微型磁性传感器 (SUPREMISE) 进行超分辨率非侵入性肌肉测量
- 批准号:
EP/X031950/1 - 财政年份:2024
- 资助金额:
$ 41.04万 - 项目类别:
Fellowship
Super selective hydrogen permeation through mixed proton and electron conducting asymmetric graphene based membrane
通过混合质子和电子传导不对称石墨烯基膜的超选择性氢渗透
- 批准号:
24K17588 - 财政年份:2024
- 资助金额:
$ 41.04万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Super流産の原因遺伝子の同定と胎児染色体正常原因不明習慣流産の病態解明
超级流产基因的鉴定和胎儿染色体正常化以及不明原因习惯性流产病理学的阐明
- 批准号:
23K24486 - 财政年份:2024
- 资助金额:
$ 41.04万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Quantum-limited super-resolution imaging
量子限制超分辨率成像
- 批准号:
EP/Y029127/1 - 财政年份:2024
- 资助金额:
$ 41.04万 - 项目类别:
Fellowship