BIGDATA: F: Collaborative Research: Design and Computation of Scalable Graph Distances in Metric Spaces: A Unified Multiscale Interpretable Perspective
BIGDATA:F:协作研究:度量空间中可扩展图距离的设计和计算:统一的多尺度可解释视角
基本信息
- 批准号:1741197
- 负责人:
- 金额:$ 102.4万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2017
- 资助国家:美国
- 起止时间:2017-09-01 至 2023-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Representations of real-world phenomena as graphs (a.k.a. networks) are ubiquitous, ranging from social and information networks, to technological, biological, chemical, and brain networks. Many graph mining tasks -- including clustering, anomaly detection, nearest neighbor, similarity search, pattern recognition, and transfer learning -- require a distance measure between graphs to be computed efficiently. The existing distance measures between graphs leave a lot to be desired. They are overwhelmingly based on heuristics. Many do not scale to graphs with millions of nodes; others do not satisfy the metric properties of non-negativity, positive definiteness, symmetry, and triangle inequality. This project studies a formal mathematical foundation covering a family of graph distances that overcome these limitations, focusing on real-world applications in biology and social network analysis. It also provides a universal methodology for parallelizing the computation of graph distance metrics within this family over massive graphs with millions of nodes, and scaling it over cloud computing resources.This project studies, designs, and evaluates graph distances that satisfy the following six properties: (1) They are scalable -- i.e., they are strictly subquadratic in runtime and achieve a speedup when computed in parallel. (2) They are metrics -- i.e., they satisfynon-negativity, positive definiteness, symmetry, and triangle inequality. (3) They are discriminative, as measured by comparisons to the "chemical distance", which finds the optimal mapping between two graphs that minimizes edge discrepancies. (4) They are statisticallyrobust -- i.e., they have confidence intervals. (5) They can incorporate auxiliary information available on nodes and links. (6) They are interpretable to subject matter experts. Rather than providing a single metric, this project explores a family of such graph distance metrics. It also provides a universal methodology, using the Alternating Directions Method of Multipliers (ADMM), to parallelizing the computation of graph distance metrics within this family over massive graphs with millions of nodes. The proposed metrics are evaluated over massive real-world graphs using Apache Spark on a cloud computing infrastructure.
现实世界现象作为图表(又称网络)的表示形式无处不在,从社会和信息网络到技术,生物学,化学和大脑网络。许多图形挖掘任务 - 包括聚类,异常检测,最近的邻居,相似性搜索,模式识别和转移学习 - 都需要有效计算的图之间的距离测量。图之间的现有距离测量值为理想。他们绝大多数是基于启发式方法。许多人没有扩展到具有数百万个节点的图形;其他人不满足非负,积极定义,对称性和三角形不平等的度量特性。该项目研究的正式数学基础涵盖了一个克服这些局限性的图形距离家族,重点是生物学和社交网络分析中的现实应用。它还提供了一种通用方法,用于使该家族中图形距离指标的计算在大量图形上具有数百万个节点,并在云计算资源上进行扩展。此项目研究,设计和评估满足以下六个属性的满足的图形距离:(1)它们是可扩展的 - 即,它们在运行时非常快速地实现运行时,并在计算中实现了快速的计算。 (2)它们是指标 - 即,它们满足了阴性,积极的定义,对称性和三角形不平等。 (3)通过与“化学距离”进行比较,它们是歧视性的,该比较发现两个图之间的最佳映射可以最大程度地减少边缘差异。 (4)它们是统计上的 - 即,它们具有置信区间。 (5)他们可以合并有关节点和链接的辅助信息。 (6)它们可以解释为主题专家。该项目没有提供单个指标,而是探索了这样的图形距离指标的家庭。它还使用乘数的交替方向方法(ADMM)提供了通用方法,以通过数百万节点的大量图并平行该家族中图形距离指标的计算。在云计算基础架构上使用Apache Spark在大量的现实图表上评估了所提出的指标。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
STABLE: Identifying and Mitigating Instability in Embeddings of the Degenerate Core
- DOI:10.1137/1.9781611977653.ch46
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:David Liu;Tina Eliassi-Rad
- 通讯作者:David Liu;Tina Eliassi-Rad
Nonbacktracking Eigenvalues under Node Removal: X-Centrality and Targeted Immunization
- DOI:10.1137/20m1352132
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Leonardo A. B. Tôrres;Kevin S. Chan;Hanghang Tong;T. Eliassi-Rad
- 通讯作者:Leonardo A. B. Tôrres;Kevin S. Chan;Hanghang Tong;T. Eliassi-Rad
Multilevel Network Alignment
- DOI:10.1145/3308558.3313484
- 发表时间:2019-05
- 期刊:
- 影响因子:0
- 作者:Si Zhang;Hanghang Tong;Ross Maciejewski;Tina Eliassi-Rad
- 通讯作者:Si Zhang;Hanghang Tong;Ross Maciejewski;Tina Eliassi-Rad
The Why, How, and When of Representations for Complex Systems
- DOI:10.1137/20m1355896
- 发表时间:2021-09-01
- 期刊:
- 影响因子:10.2
- 作者:Torres, Leo;Blevins, Ann S.;Eliassi-Rad, Tina
- 通讯作者:Eliassi-Rad, Tina
Massively Distributed Graph Distances
- DOI:10.1109/tsipn.2020.3022003
- 发表时间:2020
- 期刊:
- 影响因子:3.2
- 作者:Armin Moharrer;Jasmin Gao;Shikun Wang;José Bento;Stratis Ioannidis
- 通讯作者:Armin Moharrer;Jasmin Gao;Shikun Wang;José Bento;Stratis Ioannidis
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Stratis Ioannidis其他文献
Content Search through Comparisons
通过比较进行内容搜索
- DOI:
10.1007/978-3-642-22012-8_48 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Amin Karbasi;Stratis Ioannidis;L. Massoulié - 通讯作者:
L. Massoulié
Automated diagnosis of plus disease in retinopathy of prematurity using deep learning
使用深度学习自动诊断早产儿视网膜病变
- DOI:
10.1016/j.jaapos.2018.07.036 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
J. Campbell;James A. Brown;R. Chan;Jennifer G. Dy;Stratis Ioannidis;Deniz Erdoğmuş;Jayashree Kalpathy;M. Chiang - 通讯作者:
M. Chiang
Truthful Linear Regression
真实的线性回归
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Rachel Cummings;Stratis Ioannidis;Katrina Ligett - 通讯作者:
Katrina Ligett
Experimental Design under the Bradley-Terry Model
Bradley-Terry 模型下的实验设计
- DOI:
10.24963/ijcai.2018/304 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Yuan Guo;Peng Tian;Jayashree Kalpathy;S. Ostmo;J. Campbell;M. Chiang;Deniz Erdoğmuş;Jennifer G. Dy;Stratis Ioannidis - 通讯作者:
Stratis Ioannidis
Automated ROP Diagnostic System based on Comparisons and U-Net Segmentation
基于比较和 U-Net 分割的自动 ROP 诊断系统
- DOI:
10.1145/3453892.3454002 - 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Peng Tian;J. Dy;Deniz Erdoğmuş;S. Ostmo;J. Campbell;M. Chiang;Stratis Ioannidis - 通讯作者:
Stratis Ioannidis
Stratis Ioannidis的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Stratis Ioannidis', 18)}}的其他基金
Collaborative Research: CNS Core: Medium: Data-Centric Networks for Distributed Learning
合作研究:CNS 核心:媒介:用于分布式学习的以数据为中心的网络
- 批准号:
2107062 - 财政年份:2021
- 资助金额:
$ 102.4万 - 项目类别:
Continuing Grant
NSF Student Travel Grant for 2020 ACM International Conference on Measurement and Modeling of Computer Systems (ACM SIGMETRICS 2020)
NSF 学生旅费资助 2020 年 ACM 国际计算机系统测量和建模会议 (ACM SIGMETRICS 2020)
- 批准号:
2013756 - 财政年份:2020
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
RTML: Large: Efficient and Adaptive Real-Time Learning for Next Generation Wireless Systems
RTML:大型:下一代无线系统的高效、自适应实时学习
- 批准号:
1937500 - 财政年份:2019
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
CAREER: Leveraging Sparsity in Massively Distributed Optimization
职业:在大规模分布式优化中利用稀疏性
- 批准号:
1750539 - 财政年份:2018
- 资助金额:
$ 102.4万 - 项目类别:
Continuing Grant
NeTS: Small: Caching Networks with Optimality Guarantees
NetS:小型:具有最优性保证的缓存网络
- 批准号:
1718355 - 财政年份:2017
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Massively Scalable Secure Computation Infrastructure Using FPGAs
SaTC:CORE:小型:使用 FPGA 的大规模可扩展安全计算基础设施
- 批准号:
1717213 - 财政年份:2017
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
SCH: INT: Collaborative Research: Assistive Integrative Support Tool for Retinopathy of Prematurity
SCH:INT:合作研究:早产儿视网膜病变辅助综合支持工具
- 批准号:
1622536 - 财政年份:2016
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
相似国自然基金
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
- 批准号:72372084
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
在线医疗团队协作模式与绩效提升策略研究
- 批准号:72371111
- 批准年份:2023
- 资助金额:41 万元
- 项目类别:面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
- 批准号:62373044
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
- 批准号:82372548
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
- 批准号:32302064
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
2348159 - 财政年份:2023
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
- 批准号:
2308649 - 财政年份:2022
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
- 批准号:
2034479 - 财政年份:2020
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
- 批准号:
2027516 - 财政年份:2020
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
- 批准号:
1934319 - 财政年份:2019
- 资助金额:
$ 102.4万 - 项目类别:
Standard Grant