Flexible Modeling for High-Dimensional Complex Data: Theory, Methodology, and Computation

高维复杂数据的灵活建模:理论、方法和计算

基本信息

  • 批准号:
    1309507
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-07-01 至 2017-06-30
  • 项目状态:
    已结题

项目摘要

In high dimensional data analysis, the relationships among predictors can be highly nonlinear and non-additive, and taking into account such complex structures may significantly improve model prediction power and provide crucial insight about the underlying data generation mechanism. The goal of this project is to develop and study new statistical and data mining methodologies for detecting nonlinear and non-additive patterns in high dimensional sparse models. When the data dimension is ultra-high, interaction selection is extremely challenging, both numerically and theoretically, due to curse of dimensionality. There are very limited tools available in practice and theory is scant. In this project, the investigators give a comprehensive treatment to the problem of high-dimensional interaction selection. They propose and study novel selection and modeling techniques for a variety of regression and classification models. Fast and robust large-scale computational algorithms are derived. In addition, the investigators are committed to establishing high dimensional theory for interaction selection and providing a solid foundation for the new methods. The investigators also propose and study a unified theory and computation framework to identify nonlinear effects for a broad class of nonparametric regression models. Special effort is spent on addressing computational issues such as multiple parameter tuning, regularization solution path/surface algorithms, and development of user friendly statistical software packages.Big and high dimensional data offer us fascinating and unprecedented opportunities to gain extraordinary insight from data. On the other hand, the scale and volume of data create tremendous challenges for standard analysis tools to extract useful information. The goal of this project is to develop innovative statistical and data mining methods, solid mathematical theory, and powerful computational tools and software to capture hidden and possibly complex patterns when the data dimension is high. One challenging problem to be tackled in this project is high dimensional interaction selection. In genome-wide association studies (GWAS), there is growing evidence that gene-gene and gene-environment interactions can provide key insight about complex biological pathways that underpin human diseases. However, there are very few effective, well-grounded, and computationally attractive tools available in practice to identify interactions for high dimensional data. The investigators try to fill this gap by conducting thorough investigation on the problem. The results from this project research can significantly advance theory and as well as contribute new statistical tools for practical use. The proposed methods have a wide range of scientific applications such as biology, biomedicine, and environmental studies. This project integrates research, education, and interdisciplinary collaboration through developing new graduate and undergraduate courses and involving students in the research activities.
在高维数据分析中,预测因子之间的关系可能是高度非线性和非添加的,并且考虑到这种复杂的结构可以显着提高模型预测能力,并提供有关基本数据生成机制的重要见解。该项目的目的是开发和研究用于检测高维稀疏模型中非线性和非添加模式的新统计和数据挖掘方法。当数据维度超高时,由于维度的诅咒,相互作用的选择在数值和理论上都是极具挑战性的。实践中有非常有限的工具,理论很少。在这个项目中,研究人员对高维相互作用选择的问题进行了全面处理。他们建议并研究各种回归和分类模型的新颖选择和建模技术。得出了快速,稳健的大规模计算算法。此外,研究人员致力于建立高维理论以进行相互作用选择,并为新方法提供坚实的基础。研究人员还提出并研究了一个统一的理论和计算框架,以确定一系列非参数回归模型的非线性效应。花在解决计算问题上花费了特殊的精力,例如多个参数调整,正则化解决方案路径/表面算法以及用户友好的统计软件包的开发。BIG和高维数据为我们提供了有趣且前所未有的机会,可以从数据中获得非凡的洞察力。另一方面,数据的规模和数量为标准分析工具提出有用信息带来了巨大的挑战。该项目的目的是开发创新的统计和数据挖掘方法,可靠的数学理论以及强大的计算工具和软件,以捕获数据维度较高时隐藏和可能的复杂模式。在这个项目中要解决的一个具有挑战性的问题是高维相互作用的选择。在全基因组关联研究(GWAS)中,越来越多的证据表明,基因基因和基因环境相互作用可以提供有关基于人类疾病的复杂生物学途径的关键见解。但是,实践中可用的有效,良好和计算上有吸引力的工具几乎没有可用于确定高维数据的相互作用的工具。研究人员试图通过对问题进行彻底调查来填补这一空白。该项目研究的结果可以大大提高理论,并为实践使用贡献新的统计工具。所提出的方法具有广泛的科学应用,例如生物学,生物医学和环境研究。该项目通过开发新的研究生和本科课程并让学生从事研究活动,将研究,教育和跨学科合作整合在一起。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hao Zhang其他文献

Study on physicochemical, structural, and functional properties of Zhengdan958 and Xianyu335 cornstarch from newly harvested corn under postharvest ripening conditions at ambient temperature.
  • DOI:
    10.1016/j.heliyon.2023.e15650
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    4
  • 作者:
    Yong Cao;Xiujuan Wang;Chengbin Zhao;Hao Zhang;Mingzhu Zheng;Xiuying Xu;Jingsheng Liu
  • 通讯作者:
    Jingsheng Liu
Adaptive mesh method applied to the thermal hydraulic program of system code with a judging criterion based on the matrix error
基于矩阵误差判断准则的自适应网格法在系统代码热工水力规划中的应用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    1.9
  • 作者:
    Xiumei Zhao;C. Ying;Meng Lin;Hao Zhang;Yanhua Yang
  • 通讯作者:
    Yanhua Yang
First report of isolation and complete genome of Vibrio rotiferianus strain SSVR1601 from cage-cultured black rockfish (Sebastes schlegelii) associated with skin ulcer.
首次报告从与皮肤溃疡相关的网箱养殖黑石斑鱼 (Sebastes schlegelii) 中分离和完整基因组轮虫弧菌菌株 SSVR1601。
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Zheng Zhang;Yongxiang Yu;Yong Jiang;Yingeng Wang;M. Liao;X. Rong;Kai Wang;Hao Zhang;J. Chen
  • 通讯作者:
    J. Chen
Blockade of A2B adenosine receptor reduces left ventricular dysfunction and ventricular arrhythmias 1 week after myocardial infarction in the rat model.
在大鼠模型心肌梗塞后 1 周,阻断 A2B 腺苷受体可减少左心室功能障碍和室性心律失常。
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    5.5
  • 作者:
    Hao Zhang;H. Zhong;T. Everett;Emily E. Wilson;R. Chang;D. Zeng;L. Belardinelli;J. Olgin
  • 通讯作者:
    J. Olgin
[Quick testing-technology of transgenic rice with npt- screen marker gene].
npt-筛选标记基因转基因水稻快速检测技术[J].
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zi;Zili Yi;Zhi;Jian;J. Qin;Hao Zhang;Yan
  • 通讯作者:
    Yan

Hao Zhang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hao Zhang', 18)}}的其他基金

CAREER: Robot Reflection in Lifelong Adaptation
职业生涯:机器人在终生适应中的反思
  • 批准号:
    2308492
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CAREER: Robot Reflection in Lifelong Adaptation
职业生涯:机器人在终生适应中的反思
  • 批准号:
    1942056
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Spectroscopic photon localization microscopy for super-resolution molecular imaging
用于超分辨率分子成像的光谱光子定位显微镜
  • 批准号:
    1706642
  • 财政年份:
    2017
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
TRIPODS: UA-TRIPODS - Building Theoretical Foundations for Data Sciences
TRIPODS:UA-TRIPODS - 为数据科学奠定理论基础
  • 批准号:
    1740858
  • 财政年份:
    2017
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
I-Corps: Opticent Health-Functional Imaging For Early Disease Detection.
I-Corps:用于早期疾病检测的光学健康功能成像。
  • 批准号:
    1507501
  • 财政年份:
    2015
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
IDBR: TYPE A: Directly Integratable Photoacoustic Microscopy with Established Optical Microscopy for Comprehensive Sub-cellular Biological Imaging
IDBR:A 型:直接集成光声显微镜与成熟的光学显微镜,用于全面的亚细胞生物成像
  • 批准号:
    1353952
  • 财政年份:
    2014
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Measuring plant available phosphorus to increase crop yields and minimise nutrient leaching
测量植物有效磷以提高作物产量并最大程度地减少养分流失
  • 批准号:
    NE/M016919/1
  • 财政年份:
    2014
  • 资助金额:
    $ 15万
  • 项目类别:
    Research Grant
ABI Innovation: Gini-based methodologies to enhance network-scale transcriptome analysis in plants
ABI Innovation:基于基尼的方法增强植物网络规模转录组分析
  • 批准号:
    1261830
  • 财政年份:
    2013
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CAREER: Nonparametric Models Building, Estimation, and Selection with Applications to High Dimensional Data Mining
职业:非参数模型构建、估计和选择及其在高维数据挖掘中的应用
  • 批准号:
    1347844
  • 财政年份:
    2013
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
A genetic dissection of traits required for sustainable water use in rice using Genome Wide Association Studies (GWAS)
利用全基因组关联研究 (GWAS) 对水稻可持续用水所需的性状进行遗传剖析
  • 批准号:
    BB/J002062/1
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Research Grant

相似国自然基金

热液改造型页岩成储机理研究——以松辽盆地青一段为例
  • 批准号:
    42372150
  • 批准年份:
    2023
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
定制亲疏油图案与仿生微造型耦合的复合沟槽阵列表面润滑增效机理及应用
  • 批准号:
    52205201
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
构造型深部岩体动力灾害的孕育和发生全过程机理研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
产能共享背景下的制造型企业运营决策研究:基于信息共享与数据质量的视角
  • 批准号:
    72271252
  • 批准年份:
    2022
  • 资助金额:
    44 万元
  • 项目类别:
    面上项目
几何造型与机器学习融合的图像数据拟合问题研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

Optimization of electromechanical monitoring of engineered heart tissues
工程心脏组织机电监测的优化
  • 批准号:
    10673513
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
Neural basis of flexible decisions in naturalistic environments
自然环境中灵活决策的神经基础
  • 批准号:
    10723707
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
Prototype development and validation of soft robotic sensor arrays for mapping cardiac arrhythmia
用于绘制心律失常的软机器人传感器阵列的原型开发和验证
  • 批准号:
    10722857
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
SCH: Al-driven Flexible Electronics for Cardiac Organoid Maturation
SCH:用于心脏类器官成熟的铝驱动柔性电子器件
  • 批准号:
    10816899
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
Flexible Hybrid Cloud Infrastructure for Seamless Integration and Use of Human Biomolecular Data and Reference Maps [1 of 5]
灵活的混合云基础设施,用于无缝集成和使用人类生物分子数据和参考图 [1 of 5]
  • 批准号:
    10886340
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了