CSR: Small: Data Parallel Frameworks for Large-scale Machine Learning through Sync-on-the-Fly

CSR:小型:通过即时同步实现大规模机器学习的数据并行框架

基本信息

  • 批准号:
    1815412
  • 负责人:
  • 金额:
    $ 49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-10-01 至 2023-09-30
  • 项目状态:
    已结题

项目摘要

The advances in sensing, storage, and networking technologies have led to the collections of high-volume, high-dimensional data. Making sense of these data is critical for companies and organizations to make better business decisions, to bring convenience to our daily life, and even enable better health through biological information and drug discovery. Recent advances in machine learning have led to a flurry of data analytic techniques that typically require an iterative refinement process. However, the massive amount of data involved and potentially numerous iterations required make performing data analytics in a timely manner challenging.This project aims to design and implement a data parallel programming framework called Sync-on-the-fly. The framework enables machine learning computations within cloud computing environments to establish synchronization barriers during the execution of the computations. Since synchronization barriers are established for building consistent model parameters, they do not need to be predefined. The barriers can be established during the computation based on the progress of the computation. This data parallel programming model preserves the semantics of machine learning algorithms. The goals are to build theoretical foundations and create efficient distributed frameworks for a series of well-known machine learning algorithms, and establish the programming models for these computations.The technologies developed from this project will have immediate important applications on road traffic prediction, biological information discovery, online marketing, and computer forensic analysis. This project will bring fast, accurate, and cost-effective processing of massive data to users. This project will also train new graduate engineers in distributed framework design, machine learning algorithms, and big data analytics. All of these skillsets are in broad demand in US industry.The data and software codes produced for the distributed framework and distributed machine learning algorithms will be made publicly available at the research website http://rio.ecs.umass.edu/html/research/index.html. The website will be retained for at least three years after the conclusion of the project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
传感、存储和网络技术的进步导致了海量、高维数据的收集。理解这些数据对于公司和组织做出更好的业务决策、为我们的日常生活带来便利,甚至通过生物信息和药物发现实现更好的健康至关重要。机器学习的最新进展催生了一系列通常需要迭代细化过程的数据分析技术。然而,所涉及的大量数据以及可能需要的大量迭代使得及时执行数据分析变得具有挑战性。该项目旨在设计和实现称为同步同步的数据并行编程框架。 该框架使云计算环境中的机器学习计算能够在计算执行期间建立同步屏障。由于同步障碍是为了构建一致的模型参数而建立的,因此不需要预定义它们。 可以在计算过程中根据计算的进度来建立障碍。这种数据并行编程模型保留了机器学习算法的语义。目标是为一系列著名的机器学习算法建立理论基础和创建高效的分布式框架,并建立这些计算的编程模型。该项目开发的技术将在道路交通预测、生物信息等方面产生直接的重要应用。发现、在线营销和计算机取证分析。该项目将为用户带来海量数据的快速、准确、经济高效的处理。该项目还将培训分布式框架设计、机器学习算法和大数据分析方面的新研究生工程师。所有这些技能在美国工业界都有广泛的需求。为分布式框架和分布式机器学习算法生成的数据和软件代码将在研究网站http://rio.ecs.umass.edu/html/上公开提供研究/index.html。该网站将在项目结束后保留​​至少三年。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Proactive Data-Parallel Framework for Machine Learning
MOTrack: Real-time Configuration Adaptation for Video Analytics through Movement Tracking
MOTrack:通过运动跟踪进行视频分析的实时配置调整
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fubao Wu, Lixin Gao
  • 通讯作者:
    Fubao Wu, Lixin Gao
Guoyi Zhao, Tian Zhou, and Lixin Gao
赵国义、周田、高立新
Scalable Top-k Query on Information Networks with Hierarchical Inheritance Relations
  • DOI:
    10.1007/s10619-023-07432-2
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fubao Wu;Lixin Gao
  • 通讯作者:
    Fubao Wu;Lixin Gao
A Fault-Tolerant Distributed Framework for Asynchronous Iterative Computations
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lixin Gao其他文献

Excellent performance of aluminium anode based on dithiothreitol additives for alkaline aluminium/air batteries
基于二硫苏糖醇添加剂的碱性铝/空气电池铝负极的优异性能
  • DOI:
    10.1016/j.jpowsour.2020.227785
  • 发表时间:
    2020-03
  • 期刊:
  • 影响因子:
    9.2
  • 作者:
    Hanxue Yang;Xiaohui Li;Yijun Wang;Lixin Gao;Jin Li;Daquan Zhang;Tong Lin
  • 通讯作者:
    Tong Lin
A core stateless bandwidth broker architecture for scalable support of guaranteed services
核心无状态带宽代理架构,可扩展支持有保证的服务
Retinal nerve fiber layer and ganglion cell complex thickness as a diagnostic tool in early stage dysthyroid optic neuropathy
视网膜神经纤维层和神经节细胞复合体厚度作为早期甲状腺功能障碍性视神经病的诊断工具
  • DOI:
    10.1177/11206721211062030
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    Lihua Luo;Dongmei Li;Lixin Gao;Wei Wang
  • 通讯作者:
    Wei Wang
Modified alkaline electrolyte with 8-hydroxyquinoline and ZnO complex additives to improve Al-air battery
8-羟基喹啉和ZnO复合添加剂改性碱性电解液改善铝空气电池
  • DOI:
    10.1016/j.jpowsour.2019.05.077
  • 发表时间:
    2019-08
  • 期刊:
  • 影响因子:
    9.2
  • 作者:
    Chong Zhu;Hanxue Yang;Anqi Wu;Daquan Zhang;Lixin Gao;Tong Lin
  • 通讯作者:
    Tong Lin
Light-Weight Overlay Path Selection in a Peer-to-Peer Environment
对等环境中的轻量级覆盖路径选择

Lixin Gao的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lixin Gao', 18)}}的其他基金

FMitF: Track I: Privacy-Preserving Policy Verification of Interdomain Routing
FMITF:第一轨:域间路由的隐私保护策略验证
  • 批准号:
    1918187
  • 财政年份:
    2019
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CNS Core: Medium: Towards Logically Centralized Interdomain Routing Control
CNS 核心:中:走向逻辑集中的域间路由控制
  • 批准号:
    1900866
  • 财政年份:
    2019
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
NeTS: JUNO: Collaborative Research: Location-Based Forwarding and ID-Based Routing (LORIF) for the Future Internet
NetS:JUNO:协作研究:未来互联网的基于位置的转发和基于 ID 的路由 (LORIF)
  • 批准号:
    1402594
  • 财政年份:
    2014
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small: Theoretical Foundations and Distributed Frameworks for Iterative Computations on Massive Data
CSR:小:海量数据迭代计算的理论基础和分布式框架
  • 批准号:
    1217284
  • 财政年份:
    2012
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
DC:Small:Collaborative Research:Data Intensive Computing for General Relational Data Learning
DC:Small:协作研究:用于一般关系数据学习的数据密集型计算
  • 批准号:
    1018114
  • 财政年份:
    2010
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
Design of Multiprocess Routing under the Hierarchical Automatic Addressing
分层自动寻址下的多进程路由设计
  • 批准号:
    1036496
  • 财政年份:
    2010
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
Collaborative Research: NeTS-FIND: A Framework for Manageability in Future Routing Systems
合作研究:NetS-FIND:未来路由系统的可管理性框架
  • 批准号:
    0626617
  • 财政年份:
    2006
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
NeTS-FIND: Collaborative Research: CABO: Concurrent Architectures are Better than One
NeTS-FIND:协作研究:CABO:并发架构优于单一架构
  • 批准号:
    0626618
  • 财政年份:
    2006
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
Collaborative Research: SENSORS: Energy Efficient Communication in Sensor Networks
合作研究:传感器:传感器网络中的节能通信
  • 批准号:
    0329794
  • 财政年份:
    2003
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
On Enhancing the Stability and Scalability of Interdomain Routing
增强域间路由的稳定性和可扩展性
  • 批准号:
    0208116
  • 财政年份:
    2002
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant

相似国自然基金

复杂场景下模型—数据联合驱动的红外小目标检测研究
  • 批准号:
    62303165
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
  • 批准号:
    72372021
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
基于复杂抽样和时空效应下卫生服务调查数据的小域估计方法研究
  • 批准号:
    82304238
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
融合多源异构数据的小微企业经营风险智能识别与应对策略研究
  • 批准号:
    72301188
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于多组学数据解析合成致活效应在非小细胞肺癌对免疫检查点抑制剂耐药中的作用与机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

CSR: Small: Latency-controlled Reduction of Data Center Expenses for Handling Bursty ML Inference Requests
CSR:小:通过延迟控制减少数据中心处理突发 ML 推理请求的费用
  • 批准号:
    2336886
  • 财政年份:
    2024
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small: Enhancing Timeliness and Power-Efficiency of Real-Time Data Services
CSR:小:提高实时数据服务的及时性和能效
  • 批准号:
    2326796
  • 财政年份:
    2023
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small: Processing-in-Memory enabled Manycore Systems to Accelerate Graph Neural Network-based Data Analytics
CSR:小型:启用内存处理的众核系统可加速基于图神经网络的数据分析
  • 批准号:
    2308530
  • 财政年份:
    2023
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small: Accelerating Data Intensive Scientific Workflows with Consistency Contracts
CSR:小:通过一致性合同加速数据密集型科学工作流程
  • 批准号:
    2317556
  • 财政年份:
    2023
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small: Repurposing Spatial Memory Safety Support in Commodity Processors for Temporal Memory Safety, Other Program Analyses, Hardware-Accelerated Data Structures, and More
CSR:小:重新利用商品处理器中的空间内存安全支持,以实现临时内存安全、其他程序分析、硬件加速数据结构等
  • 批准号:
    2029720
  • 财政年份:
    2020
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了