Representation and Subspace Learning for Decentralized and Dependent Data
分散和相关数据的表示和子空间学习
基本信息
- 批准号:2015366
- 负责人:
- 金额:$ 19.9万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-07-01 至 2022-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Learning concise and informative representations of high-dimensional data is a precursor to the success of modern data analytics. However, recent years have witnessed many non-standard data regimes that impose unprecedented challenges for representation learning. The first scenario is that data are decentralized, that is, they are scattered across different places across which the communication is highly restricted. This is common for international companies that collect data worldwide, but cannot aggregate them due to constraints on network bandwidth or legal policies. The second scenario is that data exhibit significant temporal dependence, as seen in stock prices, traffic flow, and clinical trials. This project will develop novel statistical methods with theoretical guarantees to handle these modern data regimes. It also aims to train the next generation of data scientists under these important problem setups. The principal investigator (PI) will develop novel methods and theory for subspace and representation learning for decentralized and dependent data. For decentralized data, the PI plans to design and study a new methodological framework for distributed estimation of a general latent variable model. This framework requires only one round of communication of model parameters, adapts to a wide range of complex latent variable models (including those based on deep neural nets) and has been shown to yield superior numerical performance over existing approaches. Another more specific setup that the PI will consider is distributed estimation of singular spaces, with applications to spectral clustering. For dependent data, the PI will focus on learning the top singular space of a low-rank Markov transition kernel to perform state compression and dimension reduction. The PI plans to solve the problem via maximizing the log-likelihood with either nuclear-norm penalty or rank constraint. The statistical rate of the resulting M-estimator will be explicitly derived, and new optimization algorithms will be developed to compute these problems with convergence guarantee.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
学习高维数据的简洁且信息丰富的表示是现代数据分析成功的先决条件。然而,近年来出现了许多非标准数据机制,给表示学习带来了前所未有的挑战。第一种情况是数据是去中心化的,即数据分散在不同的地方,通信受到严格限制。这对于在全球范围内收集数据但由于网络带宽或法律政策的限制而无法汇总数据的国际公司来说很常见。第二种情况是数据表现出显着的时间依赖性,如股票价格、流量和临床试验所示。该项目将开发具有理论保证的新颖统计方法来处理这些现代数据体系。它还旨在在这些重要的问题设置下培训下一代数据科学家。首席研究员(PI)将为分散和相关数据的子空间和表示学习开发新的方法和理论。对于分散数据,PI 计划设计和研究一种新的方法框架,用于一般潜变量模型的分布式估计。该框架仅需要一轮模型参数通信,适用于各种复杂的潜变量模型(包括基于深度神经网络的模型),并且已被证明能够产生优于现有方法的数值性能。 PI 将考虑的另一个更具体的设置是奇异空间的分布式估计,以及谱聚类的应用。对于相关数据,PI 将专注于学习低秩马尔可夫转移核的顶部奇异空间来执行状态压缩和降维。 PI 计划通过使用核范数惩罚或秩约束最大化对数似然来解决该问题。由此产生的 M 估计器的统计率将被显式导出,并且将开发新的优化算法来计算这些具有收敛保证的问题。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和技术进行评估,被认为值得支持。更广泛的影响审查标准。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A shrinkage principle for heavy-tailed data: High-dimensional robust low-rank matrix recovery
重尾数据的收缩原理:高维鲁棒低秩矩阵恢复
- DOI:10.1214/20-aos1980
- 发表时间:2021-06
- 期刊:
- 影响因子:0
- 作者:Fan, Jianqing;Wang, Weichen;Zhu, Ziwei
- 通讯作者:Zhu, Ziwei
High-Dimensional Principal Component Analysis with Heterogeneous Missingness
异质缺失的高维主成分分析
- DOI:10.1111/rssb.12550
- 发表时间:2022-11
- 期刊:
- 影响因子:0
- 作者:Zhu, Ziwei;Wang, Tengyao;Samworth, Richard J.
- 通讯作者:Samworth, Richard J.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ziwei Zhu其他文献
Modern Data Modeling: Cross-Fertilization of the Two Cultures
现代数据建模:两种文化的交叉融合
- DOI:
10.1353/obs.2021.0023 - 发表时间:
2021-07-27 - 期刊:
- 影响因子:0
- 作者:
Jianqing Fan;Cong Ma;Kaizheng Wang;Ziwei Zhu - 通讯作者:
Ziwei Zhu
Content-Collaborative Disentanglement Representation Learning for Enhanced Recommendation
用于增强推荐的内容协作解开表示学习
- DOI:
10.1145/3383313.3412239 - 发表时间:
2020-09-22 - 期刊:
- 影响因子:0
- 作者:
Yin Zhang;Ziwei Zhu;Yun He;James Caverlee - 通讯作者:
James Caverlee
Serum Concentrations of Angiotensin, C-Reactive Protein, Interleukin-8, and Tumor Necrosis Factor-α in Train Driver Population
火车司机人群中血管紧张素、C 反应蛋白、白细胞介素 8 和肿瘤坏死因子 α 的血清浓度
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Ziwei Zhu;Linxiong Wu;Aihua Liu;Mei Zhou;Fukai Bao;Cuiping Xu;Jiaru Yang;Hua Zhao - 通讯作者:
Hua Zhao
Foraging Niche Differentiation of Five Woodpecker Species in the Primitive Broadleaved Korean Pine Forests of Northeast China
东北原始阔叶红松林五种啄木鸟的觅食生态位分化
- DOI:
10.3390/f14112166 - 发表时间:
2023-10-31 - 期刊:
- 影响因子:2.9
- 作者:
Yuhui Si;Dehuai Meng;Han Zhong;Ziwei Zhu;Hongfei Zou;Ke Rong - 通讯作者:
Ke Rong
Unsupervised Candidate Answer Extraction through Differentiable Masker-Reconstructor Model
通过可微分掩码重构器模型进行无监督候选答案提取
- DOI:
10.48550/arxiv.2310.13106 - 发表时间:
2023-10-19 - 期刊:
- 影响因子:0
- 作者:
Zhuoer Wang;Yicheng Wang;Ziwei Zhu;James Caverlee - 通讯作者:
James Caverlee
Ziwei Zhu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
四元数自表示学习在鲁棒的多通道高维数据子空间聚类中的应用
- 批准号:
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
多源数据判别特征学习的结构化自编码方法
- 批准号:61906046
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
基于潜在表示的不完整多视图子空间学习方法研究
- 批准号:61902160
- 批准年份:2019
- 资助金额:27.0 万元
- 项目类别:青年科学基金项目
基于时频稀疏表示与自适应子空间学习的相关信号盲源分离研究
- 批准号:61971296
- 批准年份:2019
- 资助金额:60 万元
- 项目类别:面上项目
面向大规模多视角图像的正交稀疏图嵌入模型与算法研究
- 批准号:61876213
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
相似海外基金
Audio-visual learning in neural network for elderly surveillance
老年人监控中神经网络的视听学习
- 批准号:
19K20335 - 财政年份:2019
- 资助金额:
$ 19.9万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning
BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近
- 批准号:
1840866 - 财政年份:2017
- 资助金额:
$ 19.9万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning
BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近
- 批准号:
1546462 - 财政年份:2015
- 资助金额:
$ 19.9万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning
BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近
- 批准号:
1546482 - 财政年份:2015
- 资助金额:
$ 19.9万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning
BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近
- 批准号:
1546500 - 财政年份:2015
- 资助金额:
$ 19.9万 - 项目类别:
Standard Grant