BIGDATA: Collaborative Research: F: IA: Statistical Learning for Big Data with Random Projections
BIGDATA:协作研究:F:IA:随机投影大数据的统计学习
基本信息
- 批准号:1545994
- 负责人:
- 金额:$ 10.06万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-09-01 至 2018-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Contemporary data-driven science and engineering problems require the development of statistical methods that do not compromise statistical accuracy, yet are computationally feasible. Data quality, particularly the heterogeneity in data measurements, is a critical factor that affects statistical accuracy in the analysis of large datasets. This project will explore and demonstrate the impact and feasibility of improving computational and statistical performances simultaneously for Big Data problems with massive datasets. The research will advance the state of knowledge in predictive statistical learning with Big Data, and be extremely valuable in applications related to financial risk management or commercial operations employing recommender systems, biology, and image analysis. A key phenomenon motivating this project is the notion that some refined ensemble methods combined with random projections can simultaneously enable the fast analysis of massive data while enhancing statistical performance. Specifically, the aims of the project are: (1) Develop new classification methods based on random projections and the random forest. By defining appropriate projections, the proposed method is shown to improve statistical accuracy for massive datasets with a large number of irrelevant noisy measurements. The theoretical properties of this method will be analyzed, and an adaptive version of the algorithm developed to optimize the computational and statistical efficiency gains; (2) Propose boosting algorithms with random projections. The statistical properties, practical performance, and implementation of the proposed random projected boosting algorithms will be investigated; (3) Develop classification methods with heterogeneities. A classification method that involves the weighted bootstrap and ensemble learning to handle heterogeneity or covariate shifts in measurements in large datasets will be developed. The random projection method will be applied to improve the proposed method for high-dimensional datasets.
当代数据驱动的科学和工程问题需要开发不损害统计准确性的统计方法,但在计算上是可行的。 数据质量,尤其是数据测量中的异质性,是影响大型数据集分析的统计准确性的关键因素。 该项目将探索并证明与大量数据集的大数据问题同时改善计算和统计性能的影响和可行性。 这项研究将通过大数据提高预测性统计学习的知识状态,并在使用推荐系统,生物学和图像分析的财务风险管理或商业操作有关的应用中非常有价值。 激发该项目的关键现象是,某些精制的集合方法与随机预测结合可以同时实现大规模数据的快速分析,同时增强统计性能。 具体而言,该项目的目的是:(1)根据随机预测和随机森林开发新的分类方法。 通过定义适当的预测,提出的方法被证明可以提高大量无关的嘈杂测量值的大量数据集的统计准确性。 将分析该方法的理论属性,并开发出算法的自适应版本,以优化计算和统计效率提高; (2)提出具有随机投影的增强算法。 将研究提出的随机预测促进算法的统计属性,实际绩效和实施; (3)开发具有异质性的分类方法。 将开发一种涉及加权引导和集合学习以处理异质性或协变量转移的分类方法。 随机投影方法将应用于改进高维数据集的建议方法。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Wen Zhou其他文献
Impact of Arctic amplification on East Asian winter climate
- DOI:
10.1080/16742834.2017.1350093 - 发表时间:
2017-07 - 期刊:
- 影响因子:2.3
- 作者:
Wen Zhou - 通讯作者:
Wen Zhou
DCDetector: An IoT terminal vulnerability mining system based on distributed deep ensemble learning under source code representation
- DOI:
10.48550/arxiv.2211.16235 - 发表时间:
2022-11 - 期刊:
- 影响因子:0
- 作者:
Wen Zhou - 通讯作者:
Wen Zhou
Comparison of the impact of two types of El Niño on tropical cyclone genesis over the South China Sea
两类厄尔尼诺对南海热带气旋生成的影响比较
- DOI:
10.1002/joc.3865 - 发表时间:
2014-06 - 期刊:
- 影响因子:0
- 作者:
Xin Wang;Wen Zhou;Chongyin Li;Dongxiao Wang - 通讯作者:
Dongxiao Wang
Influence of Partial Replacement of Si by Al on Microstructure and Properties of Nanostructured Martensitic Steel
Al部分替代Si对纳米结构马氏体钢组织与性能的影响
- DOI:
10.3390/ma12223718 - 发表时间:
2019-11 - 期刊:
- 影响因子:3.4
- 作者:
Hua Zheng;Feng Hu;Wen Zhou;Oleg Isayev;Oleks;r Hress;Serhii Yershov;Kaiming Wu - 通讯作者:
Kaiming Wu
Analysis of record-high temperature over southeast coastal China in winter 2018/2019: the combined effect of mid- to high-latitude circulation systems and SST forcing over the North Atlantic and tropical western Pacific
2018/2019年冬季中国东南沿海历史高温分析:中高纬度环流系统与北大西洋和热带西太平洋海温强迫的共同影响
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:4.9
- 作者:
Yuntao Jian;Xiaoxia Lin;Wen Zhou;Maoqiu Jia;Marco Y. T. Leung;Paxson K. Y. Cheung - 通讯作者:
Paxson K. Y. Cheung
Wen Zhou的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Wen Zhou', 18)}}的其他基金
2017 Graybill Conference on Statistical Genomics and Genetics
2017年格雷比尔统计基因组学和遗传学会议
- 批准号:
1730090 - 财政年份:2017
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
Collaborative Research: EAGER:Studying lignocellulosic fine structure and its dynamics in enzymatic hydrolysis of biomass using molecule-recognizing AFM and computational modeling
合作研究:EAGER:使用分子识别 AFM 和计算模型研究木质纤维素精细结构及其在生物质酶水解中的动力学
- 批准号:
1138734 - 财政年份:2011
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
相似国自然基金
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
- 批准号:72372084
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
在线医疗团队协作模式与绩效提升策略研究
- 批准号:72371111
- 批准年份:2023
- 资助金额:41 万元
- 项目类别:面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
- 批准号:62373044
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
- 批准号:82372548
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
- 批准号:32302064
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
2348159 - 财政年份:2023
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
- 批准号:
2308649 - 财政年份:2022
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
- 批准号:
2034479 - 财政年份:2020
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
- 批准号:
2027516 - 财政年份:2020
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
- 批准号:
1934319 - 财政年份:2019
- 资助金额:
$ 10.06万 - 项目类别:
Standard Grant