BIGDATA: F: Collaborative Research: Mining for Patterns in Graphs and High-Dimensional Data: Achieving the Limits
大数据:F:协作研究:挖掘图形和高维数据中的模式:实现极限
基本信息
- 批准号:1838251
- 负责人:
- 金额:$ 73.76万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-10-01 至 2023-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
While modern datasets are very large, the amount of information per variable is often relatively small. This includes datasets from genomics, social networks, and many applications in machine learning and artificial intelligence. For instance, in genomics we often track hundreds of thousands of genes, but only have a few hundred independent samples for each one. Similarly, online social networks are massive, but the structure of friendships only gives us a relatively small amount of data per individual. This kind of data is called "high-dimensional", and poses new challenges for mathematics, statistics, and computer science, especially when (as with all real data) they are noisy or incomplete. This project will identify exactly when and how it is mathematically possible to find patterns in these massive but noisy datasets, giving scientists across many fields a useful guide to how much data they need to draw reliable conclusions, and to develop new algorithms that will solve modern data science problems efficiently and optimally.Through the study of community detection, noisy graph isomorphism, and matrix/tensor factorization, this project will develop a general framework to 1) locate the information-theoretic limit below which the observation is too noisy to detect the underlying pattern, or even to tell if a pattern exists; 2) devise efficient algorithms that succeed all the way down to the lowest possible signal-to-noise ratio; 3) prove that important classes of algorithms need super-polynomial time in certain hard regimes.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
虽然现代数据集非常大,但每个变量的信息量通常相对较小。这包括来自基因组学、社交网络以及机器学习和人工智能领域的许多应用的数据集。例如,在基因组学中,我们经常追踪数十万个基因,但每个基因只有几百个独立样本。同样,在线社交网络规模庞大,但友谊的结构只为我们提供了相对少量的个人数据。这种数据被称为“高维”,给数学、统计学和计算机科学带来了新的挑战,特别是当它们(与所有真实数据一样)有噪声或不完整时。该项目将准确确定何时以及如何在数学上可能在这些庞大但嘈杂的数据集中找到模式,为许多领域的科学家提供有用的指导,了解他们需要多少数据才能得出可靠的结论,并开发新的算法来解决现代问题通过对社区检测、噪声图同构和矩阵/张量分解的研究,该项目将开发一个通用框架,以 1) 定位信息论极限,低于该极限时,观测值噪声太大而无法检测到基础模式,或甚至可以判断某种模式是否存在; 2)设计有效的算法,一直成功地降低信噪比; 3)证明重要类别的算法在某些硬机制下需要超多项式时间。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The planted matching problem: Phase transitions and exact results
植入匹配问题:相变和精确结果
- DOI:10.1214/20-aap1660
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:Moharrami, Mehrdad;Moore, Cristopher;Xu, Jiaming
- 通讯作者:Xu, Jiaming
The Kikuchi Hierarchy and Tensor PCA
菊池层次结构和张量 PCA
- DOI:10.1109/focs.2019.000-2
- 发表时间:2019-11
- 期刊:
- 影响因子:0
- 作者:Wein, Alexander S.;El Alaoui, Ahmed;Moore, Cristopher
- 通讯作者:Moore, Cristopher
Improved Reconstruction of Random Geometric Graphs
改进的随机几何图重建
- DOI:
- 发表时间:2022-06
- 期刊:
- 影响因子:0
- 作者:Dani, Varsha;Diaz, Josep;Hayes, Thomas P.;Moore, Cristopher.
- 通讯作者:Moore, Cristopher.
Spectral Planting and the Hardness of Refuting Cuts, Colorability, and Communities in Random Graphs
光谱种植和反驳随机图中的切割、可着色性和社区的难度
- DOI:
- 发表时间:2021-10
- 期刊:
- 影响因子:0
- 作者:Afonso S Bandeira; Jess Banks
- 通讯作者:Jess Banks
How accurate are rebuttable presumptions of pretrial dangerousness? A natural experiment from New Mexico
审前危险性的可反驳推定有多准确?
- DOI:10.1111/jels.12351
- 发表时间:2023-06
- 期刊:
- 影响因子:1.7
- 作者:Moore, Cristopher;Ferguson, Elise;Guerin, Paul
- 通讯作者:Guerin, Paul
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Cristopher Moore其他文献
A -approximation algorithm for Graphic TSP in cubic bipartite graphs
三次二分图中图形TSP的A近似算法
- DOI:
10.1016/j.dam.2015.10.038 - 发表时间:
2013-11-14 - 期刊:
- 影响因子:0
- 作者:
Jeremy Karp;R. Ravi;K. Jansen;J. Rolim;Nikhil R. Devanur;Cristopher Moore - 通讯作者:
Cristopher Moore
Majority-Vote Cellular Automata, Ising Dynamics, and P-Completeness
多数投票元胞自动机、Ising 动力学和 P 完备性
- DOI:
- 发表时间:
1997 - 期刊:
- 影响因子:0
- 作者:
Cristopher Moore - 通讯作者:
Cristopher Moore
The resolution complexity of random graph k-colorability
随机图k-着色性的分辨率复杂度
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:1.1
- 作者:
P. Beame;J. Culberson;D. Mitchell;Cristopher Moore - 通讯作者:
Cristopher Moore
Linear Consistency for Proof-of-Stake Blockchains
权益证明区块链的线性一致性
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Erica Blum;A. Kiayias;Cristopher Moore;S. Quader;A. Russell - 通讯作者:
A. Russell
Cristopher Moore的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Cristopher Moore', 18)}}的其他基金
REU Site: Computational and Mathematical Modeling of Complex Systems
REU 网站:复杂系统的计算和数学建模
- 批准号:
1757923 - 财政年份:2018
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
Convergence QL: Ideas Lab Workshop: Practical Fully-Connected Quantum Computer Challenge (PFCQC), Santa Fe Institute, August 28 - September 1, 2017
Convergence QL:创意实验室研讨会:实用全连接量子计算机挑战赛 (PFCQC),圣达菲研究所,2017 年 8 月 28 日至 9 月 1 日
- 批准号:
1744320 - 财政年份:2017
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
Convergence QL: Ideas Lab Workshop: Practical Fully-Connected Quantum Computer Challenge (PFCQC), Santa Fe Institute, August 28 - September 1, 2017
Convergence QL:创意实验室研讨会:实用全连接量子计算机挑战赛 (PFCQC),圣达菲研究所,2017 年 8 月 28 日至 9 月 1 日
- 批准号:
1744320 - 财政年份:2017
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
REU Site: Computational and Mathematical Modeling of Complex Systems
REU 网站:复杂系统的计算和数学建模
- 批准号:
1358567 - 财政年份:2014
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: The Physics of Markov Chains: Closing the Gap Between Theory and Practice
AF:小:协作研究:马尔可夫链物理学:缩小理论与实践之间的差距
- 批准号:
1219117 - 财政年份:2012
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: Representation-theoretic techniques for pseudorandomness and lower bounds
AF:小:协作研究:伪随机性和下界的表示理论技术
- 批准号:
1247081 - 财政年份:2012
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: Representation-theoretic techniques for pseudorandomness and lower bounds
AF:小:协作研究:伪随机性和下界的表示理论技术
- 批准号:
1117426 - 财政年份:2011
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
Collaborative Research: EMT/QIS: Quantum Algorithms and Post-Quantum Cryptography
合作研究:EMT/QIS:量子算法和后量子密码学
- 批准号:
0829931 - 财政年份:2008
- 资助金额:
$ 73.76万 - 项目类别:
Continuing Grant
QnTM: Collaborative Research: The Quantum Complexity of Algebraic Problems
QnTM:协作研究:代数问题的量子复杂性
- 批准号:
0524613 - 财政年份:2005
- 资助金额:
$ 73.76万 - 项目类别:
Continuing Grant
Collaborative Research: Dynamics of Boolean Networks and Gene Expression
合作研究:布尔网络和基因表达的动力学
- 批准号:
0417660 - 财政年份:2004
- 资助金额:
$ 73.76万 - 项目类别:
Continuing Grant
相似国自然基金
基于交易双方异质性的工程项目组织间协作动态耦合研究
- 批准号:72301024
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
- 批准号:
- 批准年份:2022
- 资助金额:45 万元
- 项目类别:面上项目
面向协作感知车联网的信息分发时效性保证关键技术研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于自主性边界的人机协作-对抗混合智能控制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
2348159 - 财政年份:2023
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
- 批准号:
2308649 - 财政年份:2022
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
- 批准号:
2027516 - 财政年份:2020
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
- 批准号:
2034479 - 财政年份:2020
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management
大数据:F:协作研究:负责任的数据管理的基础
- 批准号:
1926250 - 财政年份:2019
- 资助金额:
$ 73.76万 - 项目类别:
Standard Grant