AF: Small: Collaborative Research: Algorithmic and Computational Frontiers of MapReduce for Big Data Analysis
AF:小型:协作研究:用于大数据分析的 MapReduce 算法和计算前沿
基本信息
- 批准号:1617653
- 负责人:
- 金额:$ 24.72万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-07-01 至 2022-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Modern science and engineering heavily relies on processing massive data sets and the size of the data requires applications to run using distributed computing frameworks. However, many existing methods essential to the applications are not easily adapted to work in distributed settings. This project aims to develop new efficient ways of processing large data sets in widely used distributed computing platforms. The project will reveal new methods for processing diverse and complex data sets of massive size and allow for various applications scale to large inputs. The work has the potential to fundamentally change algorithmic techniques used in distributed computing, helping to shape big data research, the computing industry, and the growing economy reliant on big data analysis. Research outcomes will be integrated with education by writing an extensive survey/tutorial on the core algorithmic ideas used in the new discoveries to make the ideas transparent to the algorithmic developers and practitioners. The PIs will make some of the discovered algorithmic ideas accessible even to undergraduate students, helping them get prepared to cope with algorithmic challenges in distributed computing for large data sets. Special efforts will be made to include women and minorities in advising and mentoring plans.The main goal of the project is to find new ways of unlocking the underlying power of MapReduce, a popular distributed platform, through the development of new algorithmics. The developed algorithms should have provably strong guarantees and demonstrate the effectiveness via empirical experiments. Considering the increasing demand for large data analysis, establishing a solid theoretical MapReduce model and developing new algorithmic ideas will have the potential to establish faster and memory efficient algorithms for distributed computing. The PIs will consider a collection of carefully chosen problems to understand in the MapReduce setting that not only have strong connections to theoretical work but also have the potential for high impact in real world Big Data applications: Clustering, Distributed Dynamic Programming, and Limitations of MapReduce. This will be done in parallel with the attempt to better understand the currently accepted MapReduce models that have been developed and to perhaps further refine them to better connect models with practice.
现代科学和工程在很大程度上依赖于处理大量数据集,并且数据的大小需要使用分布式计算框架运行的应用程序。 但是,许多对应用程序必不可少的现有方法不容易适应分布式设置的工作。该项目旨在开发新的有效方法来处理广泛使用的分布式计算平台中的大型数据集。该项目将揭示用于处理庞大大小的多样化和复杂数据集的新方法,并允许各种应用程序扩展到大型输入。这项工作有可能从根本上改变用于分布式计算的算法技术,有助于塑造大数据研究,计算行业以及依赖大数据分析的不断增长的经济。研究成果将通过撰写有关新发现中使用的核心算法思想的广泛调查/教程,以使这些想法与算法开发人员和从业者透明。 PI将使一些发现的算法想法甚至可以访问本科生,从而帮助他们准备应对大型数据集的分布式计算时应对算法挑战。将要采取特殊努力,包括妇女和少数民族在为计划提供建议和指导计划中。该项目的主要目标是通过开发新算法的开发来找到新的方法来解锁MapReduce的潜在力量,这是一个受欢迎的分布式平台。开发的算法应证明具有强大的保证,并通过经验实验证明了有效性。考虑到对大型数据分析的需求不断增长,建立一个可靠的理论MAPREDUCE模型并开发新的算法思想将有可能建立更快,更快的记忆有效算法来分布式计算。 PI将考虑在MapReduce设置中理解的精心选择的问题的集合,这些问题不仅与理论工作具有牢固的联系,而且还具有在现实世界中的大数据应用中产生高影响的潜力:聚类,分布式动态编程和MapReduce的局限性。这将与尝试更好地理解已开发的当前接受的MapReduce模型的尝试同时完成,并可能进一步完善它们以更好地将模型与练习联系起来。
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Weighted Completion Time Minimization for Unrelated Machines via Iterative Fair Contention Resolution
- DOI:10.1137/1.9781611975994.170
- 发表时间:2020-01
- 期刊:
- 影响因子:0
- 作者:Sungjin Im;Maryam Shadloo
- 通讯作者:Sungjin Im;Maryam Shadloo
Online Knapsack with Frequency Predictions
带有频率预测的在线背包
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Im, Sungjin;Kumar, Ravi;Montazer Qaem, Mahshid;Purohit, Manish
- 通讯作者:Purohit, Manish
Instance Optimal Join Size Estimation
实例最佳连接大小估计
- DOI:10.1016/j.procs.2021.11.019
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Abo-Khamis, Mahmoud;Im, Sungjin;Moseley, Benjamin;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
A Relational Gradient Descent Algorithm For Support Vector Machine Training
支持向量机训练的关系梯度下降算法
- DOI:10.1137/1.9781611976489.8
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Abo-Khamis, M.;Im, S.;Moseley, B.;Pruhs, K.;Samadian, A.
- 通讯作者:Samadian, A.
Faster Matchings via Learned Duals
- DOI:
- 发表时间:2021-07
- 期刊:
- 影响因子:0
- 作者:M. Dinitz;Sungjin Im;Thomas Lavastida;Benjamin Moseley;Sergei Vassilvitskii
- 通讯作者:M. Dinitz;Sungjin Im;Thomas Lavastida;Benjamin Moseley;Sergei Vassilvitskii
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sungjin Im其他文献
Online scalable scheduling for the lk-norms of flow time without conservation of work
无需工作保护的 lk 范数在线可扩展调度
- DOI:
10.1137/1.9781611973082.9 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
J. Edmonds;Sungjin Im;Benjamin Moseley - 通讯作者:
Benjamin Moseley
Online scheduling algorithms for average flow time and its variants
- DOI:
- 发表时间:
2012-09 - 期刊:
- 影响因子:0
- 作者:
Sungjin Im - 通讯作者:
Sungjin Im
Coordination mechanisms from (almost) all scheduling policies
来自(几乎)所有调度策略的协调机制
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Sayan Bhattacharya;Sungjin Im;Janardhan Kulkarni;Kamesh Munagala - 通讯作者:
Kamesh Munagala
Competitively scheduling tasks with intermediate parallelizability
具有中等并行性的竞争性调度任务
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Sungjin Im;Benjamin Moseley;K. Pruhs;E. Torng - 通讯作者:
E. Torng
Minimizing Maximum Flow Time on Related Machines via Dynamic Posted Pricing
通过动态发布定价最大限度地减少相关机器上的最大流程时间
- DOI:
10.4230/lipics.esa.2017.51 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Sungjin Im;Benjamin Moseley;K. Pruhs;C. Stein - 通讯作者:
C. Stein
Sungjin Im的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sungjin Im', 18)}}的其他基金
Collaborative Research: AF: Small: Foundations of Algorithms Augmented with Predictions
合作研究:AF:小型:预测增强的算法基础
- 批准号:
2121745 - 财政年份:2022
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant
CAREER: New Algorithmic Foundations for Online Scheduling
职业:在线调度的新算法基础
- 批准号:
1844939 - 财政年份:2019
- 资助金额:
$ 24.72万 - 项目类别:
Continuing Grant
AF: Medium: Collaborative Research: Multi-dimensional Scheduling and Resource Allocation in Data Centers
AF:中:协同研究:数据中心多维调度与资源分配
- 批准号:
1409130 - 财政年份:2014
- 资助金额:
$ 24.72万 - 项目类别:
Continuing Grant
相似国自然基金
基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
- 批准号:
- 批准年份:2020
- 资助金额:57 万元
- 项目类别:面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
- 批准号:61661005
- 批准年份:2016
- 资助金额:30.0 万元
- 项目类别:地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
- 批准号:61301143
- 批准年份:2013
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
- 批准号:81072465
- 批准年份:2010
- 资助金额:31.0 万元
- 项目类别:面上项目
基于小世界网络的传感器网络研究
- 批准号:60472059
- 批准年份:2004
- 资助金额:21.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342244 - 财政年份:2024
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Exploring the Frontiers of Adversarial Robustness
合作研究:AF:小型:探索对抗鲁棒性的前沿
- 批准号:
2335411 - 财政年份:2024
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant
NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
- 批准号:
2420942 - 财政年份:2024
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Structural Graph Algorithms via General Frameworks
合作研究:AF:小型:通过通用框架的结构图算法
- 批准号:
2347322 - 财政年份:2024
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
- 批准号:
2331401 - 财政年份:2024
- 资助金额:
$ 24.72万 - 项目类别:
Standard Grant