CAREER: Pushing the Theoretical Limits of Scalable Distributed Algorithms
职业:突破可扩展分布式算法的理论极限
基本信息
- 批准号:1845146
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-07-01 至 2025-06-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Science and engineering are becoming more reliant on analyzing data sets that have massive size. Processing these data sets typically requires using many machines, such as on the cloud, meaning that algorithms and software for data processing need to be redesigned to efficiently use a large number of machines. This project will give algorithmic techniques for distributed computing models (aka frameworks) such as Spark. Such a framework enables programmers to easily deploy algorithms on tens to thousands of machines as long as the algorithm fits into the computational restrictions of the framework. The algorithmic primitives developed will be tools that algorithm designers and programmers can leverage to analyze large amounts of data on many machines. This will impact industry, science and the economy that is increasingly reliant on large data analysis. Research outcomes will be integrated with education by including the latest research on data analytics in the undergraduate and master of science in business analytics programs. Massively distributed frameworks such as Spark and MapReduce are a key technology for processing large data sets. These systems have traditionally been used to solve relatively simple problems. Recent investigation has shown they are potentially useful for a richer class of applications. With this potential as a proof-of-concept, this project will discover algorithmic techniques tailored to these frameworks to unlock their underlying power and broaden their applicability. A recently developed theoretical model of computation will be used to drive the development of algorithmic techniques designed to leverage the unique features of the frameworks. The new algorithms and techniques will be used to offer scalable solutions for key problems arising in graph processing, data mining, and bioinformatics. Specifically, the project will develop algorithms to compute shortest paths on massive graphs, algorithms for local alignment of biological sequences and some of the first provably scalable algorithms for hierarchical clustering. Achieving these goals can influence practice and theoretical research similarly to successes in other areas such as streaming algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
科学和工程越来越依赖分析具有庞大规模的数据集。处理这些数据集通常需要使用许多机器,例如在云上,这意味着需要重新设计用于数据处理的算法和软件以有效地使用大量机器。该项目将为分布式计算模型(又称Spark)提供算法技术。这样的框架使程序员能够轻松地将算法在数十个机器上部署到数千台机器上,只要算法拟合到框架的计算限制中。开发的算法原始算法将是算法设计师和程序员可以利用的工具来分析许多机器上的大量数据。这将影响行业,科学和经济越来越依赖大型数据分析。研究成果将与教育融为一体,包括在本科和商业分析计划的科学硕士学位上进行数据分析的最新研究。大量分布式框架(例如Spark和MapReduce)是处理大型数据集的关键技术。传统上,这些系统用于解决相对简单的问题。最近的调查表明,它们可能对更丰富的应用程序有用。凭借这种潜力作为概念验证,该项目将发现针对这些框架量身定制的算法技术,以解锁其潜在的能力并扩大其适用性。最近开发的计算理论模型将用于推动旨在利用框架独特功能的算法技术的开发。新的算法和技术将用于提供可扩展的解决方案,以解决图形处理,数据挖掘和生物信息学中产生的关键问题。 具体而言,该项目将开发算法,以计算大量图的最短路径,用于生物序列局部比对的算法以及一些可证明可扩展的算法用于层次聚类。实现这些目标可能会影响实践和理论研究,类似于其他领域的成功,例如流媒体算法。该奖项反映了NSF的法定任务,并且使用基金会的知识分子优点和更广泛的影响评估审查标准,被认为值得通过评估来提供支持。
项目成果
期刊论文数量(47)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Predictive Flows for Faster Ford-Fulkerson
- DOI:10.48550/arxiv.2303.00837
- 发表时间:2023-03
- 期刊:
- 影响因子:0
- 作者:Sami Davies;Benjamin Moseley;Sergei Vassilvitskii;Yuyan Wang
- 通讯作者:Sami Davies;Benjamin Moseley;Sergei Vassilvitskii;Yuyan Wang
A Framework for Parallelizing Hierarchical Clustering Methods
- DOI:10.1007/978-3-030-46150-8_5
- 发表时间:2019-09
- 期刊:
- 影响因子:0
- 作者:Silvio Lattanzi;Thomas Lavastida;Kefu Lu;Benjamin Moseley
- 通讯作者:Silvio Lattanzi;Thomas Lavastida;Kefu Lu;Benjamin Moseley
Practically Efficient Scheduler for Minimizing Average Flow Time of Parallel Jobs
实用高效的调度程序,可最大限度地减少并行作业的平均流程时间
- DOI:10.1109/ipdps.2019.00024
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Agrawal, Kunal;Lee, I-Ting Angelina;Li, Jing;Lu, Kefu;Moseley, Benjamin
- 通讯作者:Moseley, Benjamin
An Approximation Algorithm for the Matrix Tree Multiplication Problem
- DOI:10.4230/lipics.mfcs.2021.6
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Mahmoud Abo Khamis;Ryan R. Curtin;Sungjin Im;Benjamin Moseley;H. Ngo;K. Pruhs;Alireza Samadian
- 通讯作者:Mahmoud Abo Khamis;Ryan R. Curtin;Sungjin Im;Benjamin Moseley;H. Ngo;K. Pruhs;Alireza Samadian
Scheduling for Weighted Flow and Completion Times in Reconfigurable Networks
- DOI:10.1109/infocom41043.2020.9155537
- 发表时间:2020-01
- 期刊:
- 影响因子:0
- 作者:M. Dinitz;Benjamin Moseley
- 通讯作者:M. Dinitz;Benjamin Moseley
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Benjamin Moseley其他文献
Scheduling to minimize energy and flow time in broadcast scheduling
在广播调度中最小化能量和流时间的调度
- DOI:
10.1007/s10951-014-0371-3 - 发表时间:
2010 - 期刊:
- 影响因子:2
- 作者:
Benjamin Moseley - 通讯作者:
Benjamin Moseley
Non-clairvoyantly Scheduling to Minimize Convex Functions
非透视调度以最小化凸函数
- DOI:
10.1007/s00453-019-00597-2 - 发表时间:
2019 - 期刊:
- 影响因子:1.1
- 作者:
K. Fox;Sungjin Im;Janardhan Kulkarni;Benjamin Moseley - 通讯作者:
Benjamin Moseley
On the Randomized Competitive Ratio of Reordering Buffer Management with Non-Uniform Costs
成本不均匀的重排序缓冲区管理的随机竞争比
- DOI:
10.1007/978-3-662-47672-7_7 - 发表时间:
2015 - 期刊:
- 影响因子:2
- 作者:
Noa Avigdor;Sungjin Im;Benjamin Moseley;Y. Rabani - 通讯作者:
Y. Rabani
General Profit Scheduling and the Power of Migration on Heterogeneous Machines
一般利润计划和异构机器上的迁移能力
- DOI:
10.1145/2935764.2935771 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Sungjin Im;Benjamin Moseley - 通讯作者:
Benjamin Moseley
Online scalable scheduling for the lk-norms of flow time without conservation of work
无需工作保护的 lk 范数在线可扩展调度
- DOI:
10.1137/1.9781611973082.9 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
J. Edmonds;Sungjin Im;Benjamin Moseley - 通讯作者:
Benjamin Moseley
Benjamin Moseley的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Benjamin Moseley', 18)}}的其他基金
Collaborative Research: AF: Small: Foundations of Algorithms Augmented with Predictions
合作研究:AF:小型:预测增强的算法基础
- 批准号:
2121744 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: Algorithmic and Computational Frontiers of MapReduce for Big Data Analysis
AF:小型:协作研究:用于大数据分析的 MapReduce 算法和计算前沿
- 批准号:
1830711 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SPX: Collaborative Research: Harnessing the Power of High-Bandwidth Memory via Provably Efficient Parallel Algorithms
SPX:协作研究:通过可证明高效的并行算法利用高带宽内存的力量
- 批准号:
1824303 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SPX: Collaborative Research: Harnessing the Power of High-Bandwidth Memory via Provably Efficient Parallel Algorithms
SPX:协作研究:通过可证明高效的并行算法利用高带宽内存的力量
- 批准号:
1725661 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
AF: Small: Collaborative Research: Algorithmic and Computational Frontiers of MapReduce for Big Data Analysis
AF:小型:协作研究:用于大数据分析的 MapReduce 算法和计算前沿
- 批准号:
1617724 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
量子因果结构对信息理论的推动
- 批准号:11675136
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
推动电动汽车发展的充换电服务网络演变类比研究及其与配电网协同规划理论
- 批准号:51377111
- 批准年份:2013
- 资助金额:78.0 万元
- 项目类别:面上项目
微观视角下成本推动型通货膨胀的甄别及反通胀政策:基于非线性面板平滑转换模型的理论与应用研究
- 批准号:71201174
- 批准年份:2012
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
超高速扫描探针显微镜中的L1自适应控制理论研究
- 批准号:61104008
- 批准年份:2011
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
单螺杆挤出机新型挤出理论研究
- 批准号:50873014
- 批准年份:2008
- 资助金额:32.0 万元
- 项目类别:面上项目
相似海外基金
Pushing the envelope: atomic force microscopy imaging of the bacterial outer membrane during growth and division
挑战极限:生长和分裂过程中细菌外膜的原子力显微镜成像
- 批准号:
BB/X007669/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
Pushing the limits of electronic delocalization in organic molecules
突破有机分子电子离域的极限
- 批准号:
DE240100664 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Discovery Early Career Researcher Award
Galactic Outflows: Pushing the Distance Frontiers
银河流出:推动距离边界
- 批准号:
DE240100136 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Discovery Early Career Researcher Award
Pushing the Limits of High-Field Solid-State NMR Technology: Enhancing Applications to Advanced Materials, the Life Sciences and Pharmaceuticals
突破高场固态核磁共振技术的极限:增强先进材料、生命科学和制药的应用
- 批准号:
EP/Z532836/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant
Pushing the envelope: atomic force microscopy imaging of the bacterial outer membrane during growth and division
挑战极限:生长和分裂过程中细菌外膜的原子力显微镜成像
- 批准号:
BB/X00760X/1 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Research Grant