BIGDATA: F: Collaborative Research: Mining for Patterns in Graphs and High-Dimensional Data: Achieving the Limits

大数据:F:协作研究:挖掘图形和高维数据中的模式:实现极限

基本信息

  • 批准号:
    1838124
  • 负责人:
  • 金额:
    $ 34.52万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-10-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

While modern datasets are very large, the amount of information per variable is often relatively small. This includes datasets from genomics, social networks, and many applications in machine learning and artificial intelligence. For instance, in genomics we often track hundreds of thousands of genes, but only have a few hundred independent samples for each one. Similarly, online social networks are massive, but the structure of friendships only gives us a relatively small amount of data per individual. This kind of data is called "high-dimensional", and poses new challenges for mathematics, statistics, and computer science, especially when (as with all real data) they are noisy or incomplete. This project will identify exactly when and how it is mathematically possible to find patterns in these massive but noisy datasets, giving scientists across many fields a useful guide to how much data they need to draw reliable conclusions, and to develop new algorithms that will solve modern data science problems efficiently and optimally.Through the study of community detection, noisy graph isomorphism, and matrix/tensor factorization, this project will develop a general framework to 1) locate the information-theoretic limit below which the observation is too noisy to detect the underlying pattern, or even to tell if a pattern exists; 2) devise efficient algorithms that succeed all the way down to the lowest possible signal-to-noise ratio; 3) prove that important classes of algorithms need super-polynomial time in certain hard regimes.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
尽管现代数据集很大,但每个变量的信息量通常相对较小。这包括来自基因组学,社交网络以及机器学习和人工智能中许多应用的数据集。例如,在基因组学中,我们经常跟踪数十万个基因,但每个基因只有几百个独立样本。同样,在线社交网络是巨大的,但是友谊的结构只为我们每个人提供了相对较少的数据。这种数据称为“高维”,并对数学,统计和计算机科学提出了新的挑战,尤其是在(与所有真实数据一样)它们嘈杂或不完整时。该项目将确切地确定在数学上何时以及如何在这些庞大但嘈杂的数据集中找到模式,为许多领域的科学家提供了一个有用的指南,以指出他们需要多少数据来得出可靠的结论,并开发新的算法,以有效地和最佳地解决现代数据科学问题。 1)找到信息理论极限,在该限制下观察到太嘈杂,无法检测到基本模式,甚至可以判断是否存在模式; 2)设计有效的算法,这些算法一直成功地至最低的信噪比; 3)证明,重要的类算法需要在某些硬性制度中进行超级顺序的时间。该奖项反映了NSF的法定任务,并且使用基金会的知识分子优点和更广泛的审查标准,认为值得通过评估来获得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hidden Hamiltonian Cycle Recovery via Linear Programming
  • DOI:
    10.1287/opre.2019.1886
  • 发表时间:
    2018-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    V. Bagaria;Jian Ding;David Tse;Yihong Wu;Jiaming Xu
  • 通讯作者:
    V. Bagaria;Jian Ding;David Tse;Yihong Wu;Jiaming Xu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jiaming Xu其他文献

Achieving exact cluster recovery threshold via semidefinite programming under the stochastic block model
随机块模型下通过半定规划实现精确的簇恢复阈值
Deduction of CDC42EP3 suppress development and progression of osteosarcoma.
CDC42EP3的扣除可抑制骨肉瘤的发生和进展。
  • DOI:
    10.1016/j.yexcr.2022.113018
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    P. Xu;Xiaoxi Li;Chao Tang;Tao Wang;Jiaming Xu
  • 通讯作者:
    Jiaming Xu
Jointly clustering rows and columns of binary matrices: algorithms and trade-offs
对二元矩阵的行和列进行联合聚类:算法和权衡
  • DOI:
    10.1145/2591971.2592005
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiaming Xu;Rui Wu;Kai Zhu;B. Hajek;R. Srikant;Lei Ying
  • 通讯作者:
    Lei Ying
Mechanical Design and Affective Interaction of Bionic Robot Head
仿生机器人头部的机械设计与情感交互
  • DOI:
    10.1166/asl.2011.1297
  • 发表时间:
    2011-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lun Xie;Zhiliang Wang;Jiaming Xu
  • 通讯作者:
    Jiaming Xu
Collaboratively Learning Preferences from Ordinal Data
从序数数据中协作学习偏好

Jiaming Xu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jiaming Xu', 18)}}的其他基金

CAREER: Federated Learning: Statistical Optimality and Provable Security
职业:联邦学习:统计最优性和可证明的安全性
  • 批准号:
    2144593
  • 财政年份:
    2022
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Continuing Grant
CIF: Medium: Collaborative Research: Learning in Networks: Performance Limits and Algorithms
CIF:媒介:协作研究:网络学习:性能限制和算法
  • 批准号:
    1856424
  • 财政年份:
    2019
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Continuing Grant
CRII: CIF: Learning Hidden Structures in Networks: Fundamental Limits and Efficient Algorithms
CRII:CIF:学习网络中的隐藏结构:基本限制和高效算法
  • 批准号:
    1755960
  • 财政年份:
    2018
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
CRII: CIF: Learning Hidden Structures in Networks: Fundamental Limits and Efficient Algorithms
CRII:CIF:学习网络中的隐藏结构:基本限制和高效算法
  • 批准号:
    1850743
  • 财政年份:
    2018
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Mining for Patterns in Graphs and High-Dimensional Data: Achieving the Limits
大数据:F:协作研究:挖掘图形和高维数据中的模式:实现极限
  • 批准号:
    1932630
  • 财政年份:
    2018
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant

相似国自然基金

数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
  • 批准号:
    82372548
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
  • 批准号:
    1934319
  • 财政年份:
    2019
  • 资助金额:
    $ 34.52万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了