BIGDATA: Collaborative Research: F: IA: Statistical Learning for Big Data with Random Projections

BIGDATA:协作研究:F:IA:随机投影大数据的统计学习

基本信息

  • 批准号:
    1545994
  • 负责人:
  • 金额:
    $ 10.06万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2018-08-31
  • 项目状态:
    已结题

项目摘要

Contemporary data-driven science and engineering problems require the development of statistical methods that do not compromise statistical accuracy, yet are computationally feasible. Data quality, particularly the heterogeneity in data measurements, is a critical factor that affects statistical accuracy in the analysis of large datasets. This project will explore and demonstrate the impact and feasibility of improving computational and statistical performances simultaneously for Big Data problems with massive datasets. The research will advance the state of knowledge in predictive statistical learning with Big Data, and be extremely valuable in applications related to financial risk management or commercial operations employing recommender systems, biology, and image analysis. A key phenomenon motivating this project is the notion that some refined ensemble methods combined with random projections can simultaneously enable the fast analysis of massive data while enhancing statistical performance. Specifically, the aims of the project are: (1) Develop new classification methods based on random projections and the random forest. By defining appropriate projections, the proposed method is shown to improve statistical accuracy for massive datasets with a large number of irrelevant noisy measurements. The theoretical properties of this method will be analyzed, and an adaptive version of the algorithm developed to optimize the computational and statistical efficiency gains; (2) Propose boosting algorithms with random projections. The statistical properties, practical performance, and implementation of the proposed random projected boosting algorithms will be investigated; (3) Develop classification methods with heterogeneities. A classification method that involves the weighted bootstrap and ensemble learning to handle heterogeneity or covariate shifts in measurements in large datasets will be developed. The random projection method will be applied to improve the proposed method for high-dimensional datasets.
当代数据驱动的科学和工程问题需要开发既不影响统计准确性又在计算上可行的统计方法。 数据质量,特别是数据测量的异质性,是影响大型数据集分析统计准确性的关键因素。 该项目将探索并展示针对海量数据集的大数据问题同时提高计算和统计性能的影响和可行性。 该研究将提升大数据预测统计学习的知识水平,并且在与金融风险管理或采用推荐系统、生物学和图像分析的商业运营相关的应用中非常有价值。 推动该项目的一个关键现象是一些改进的集成方法与随机投影相结合可以同时实现海量数据的快速分析,同时提高统计性能。 具体来说,该项目的目标是:(1)开发基于随机投影和随机森林的新分类方法。 通过定义适当的投影,所提出的方法可以提高具有大量不相关噪声测量的海量数据集的统计准确性。 将分析该方法的理论特性,并开发该算法的自适应版本以优化计算和统计效率增益; (2) 提出具有随机投影的增强算法。 将研究所提出的随机投影增强算法的统计特性、实际性能和实现; (3)开发具有异质性的分类方法。 将开发一种分类方法,涉及加权引导和集成学习,以处理大型数据集中测量的异质性或协变量变化。 将应用随机投影方法来改进针对高维数据集所提出的方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wen Zhou其他文献

Precoding methods for multi-input multi-ouput interference channels with channel covariance Feedback
  • DOI:
    10.1049/iet-com.2014.0636
  • 发表时间:
    2015-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wen Zhou
  • 通讯作者:
    Wen Zhou
Capacity Optimization for Cell-Free MIMO Systems With Mean and Covariance Feedback
利用均值和协方差反馈进行无小区 MIMO 系统的容量优化
  • DOI:
    10.1109/lcomm.2023.3348596
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wen Zhou;Yihan Xu;Min Hua;Chunguo Li
  • 通讯作者:
    Chunguo Li
Characteristics of Microbial Community in Degradation Agriculture Solidwastes
农业固体废弃物降解微生物群落特征
Deep spectral feature pyramid in the frequency domain for long-term action recognition
用于长期动作识别的频域深谱特征金字塔
MIMO system capacity with imperfect feedback channel
反馈通道不完善的MIMO系统容量

Wen Zhou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wen Zhou', 18)}}的其他基金

2017 Graybill Conference on Statistical Genomics and Genetics
2017年格雷比尔统计基因组学和遗传学会议
  • 批准号:
    1730090
  • 财政年份:
    2017
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER:Studying lignocellulosic fine structure and its dynamics in enzymatic hydrolysis of biomass using molecule-recognizing AFM and computational modeling
合作研究:EAGER:使用分子识别 AFM 和计算模型研究木质纤维素精细结构及其在生物质酶水解中的动力学
  • 批准号:
    1138734
  • 财政年份:
    2011
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant

相似国自然基金

基于交易双方异质性的工程项目组织间协作动态耦合研究
  • 批准号:
    72301024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向协作感知车联网的信息分发时效性保证关键技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数据物理驱动的车间制造服务协作可靠性机理与优化方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
  • 批准号:
    1934319
  • 财政年份:
    2019
  • 资助金额:
    $ 10.06万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了