II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing

II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施

基本信息

  • 批准号:
    1405688
  • 负责人:
  • 金额:
    $ 49.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-08-01 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

The ability for organizations to process enormous quantities of data and to extract insights from those data has revolutionized commerce and science. This phenomenon, known as "big data", is shaping the very fabric of our society. Our insatiable appetite for more data, and knowledge from the data, requires significant computational infrastructure for storage and analytical capabilities. Continued investments in infrastructure for academic researchers are vital from two perspectives: From the research perspective, the university's ability to help advance the state of the art in big data technologies is dependent on access to the right computational resources. From the educational perspective, the university's mission to train the next generation of scientists and engineers cannot be successfully accomplished without big data infrastructure that is becoming essential to their careers. The goal of this project is to provide computational resources to researchers at the University of Maryland to continuing envisioning the future of big data.The modern empirical approach to tackling many challenges in natural language processing, information retrieval, data mining, machine learning, and other related domains involves exploiting large amounts of data to learn statistical models that are able to capture characteristics of the problem. A necessary ingredient to this "big data" approach is scalable infrastructure that can distribute computations across a cluster of machines. Hadoop, the open-source implementation of MapReduce, has achieved widespread adoption as the de facto platform for data-intensive computing.Broadly speaking, MapReduce excels at large-scale content analysis in an offline, batch setting. However, this is not enough: we need a data-intensive computing platform that supports heterogeneous models of computation. Hadoop NextGen (aka YARN), provides exactly this: it allows a physical cluster to support a wide range of computational models via a generic resource allocation framework.This project supports the acquisition of a Hadoop NextGen cluster at the University of Maryland to support the following activities:1. To explore computational models beyond MapReduce, including batch/online tradeoffs in machine learning, real-time streaming computations, and graph processing.2. To sustain innovations in algorithms for content analysis as well as modeling implicit and latent relationships between heterogeneous content (text, images, graphs, etc.) at scale.3. To exploit novel hardware architectures for data-intensive computing (e.g., Graphics Processing Units and Solid State Drives).These resources will help the Laboratory for Computational Linguistics and Information Processing (CLIP) and collaborators at the University of Maryland sustain and enhance its successful record of innovation and the integration of research and education.
组织处理大量数据并从这些数据中提取见解的能力已经彻底改变了商业和科学。这种被称为“大数据”的现象正在塑造我们社会的结构。我们对更多数据以及从数据中获取知识的需求永无止境,因此需要大量的计算基础设施来存储和分析能力。 从两个角度来看,对学术研究人员基础设施的持续投资至关重要:从研究角度来看,大学帮助推进大数据技术最先进水平的能力取决于对正确计算资源的访问。从教育的角度来看,如果没有大数据基础设施,大学培养下一代科学家和工程师的使命就无法成功完成,而大数据基础设施对他们的职业生涯至关重要。 该项目的目标是为马里兰大学的研究人员提供计算资源,以继续展望大数据的未来。解决自然语言处理、信息检索、数据挖掘、机器学习等领域的许多挑战的现代实证方法相关领域涉及利用大量数据来学习能够捕获问题特征的统计模型。这种“大数据”方法的一个必要组成部分是可扩展的基础设施,它可以跨机器集群分配计算。 Hadoop 是 MapReduce 的开源实现,作为数据密集型计算事实上的平台已得到广泛采用。从广义上讲,MapReduce 擅长在离线、批处理环境中进行大规模内容分析。然而,这还不够:我们需要一个支持异构计算模型的数据密集型计算平台。 Hadoop NextGen(又名 YARN)正是提供了这一点:它允许物理集群通过通用资源分配框架支持广泛的计算模型。该项目支持在马里兰大学购买 Hadoop NextGen 集群,以支持以下功能活动:1。探索 MapReduce 之外的计算模型,包括机器学习中的批量/在线权衡、实时流计算和图形处理。2.维持内容分析算法的创新以及大规模异构内容(文本、图像、图形等)之间隐式和潜在关系的建模。3.利用新颖的硬件架构进行数据密集型计算(例如图形处理单元和固态驱动器)。这些资源将帮助计算语言学和信息处理实验室 (CLIP) 以及马里兰大学的合作者维持并提高其成功记录创新以及研究与教育的整合。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jimmy Lin其他文献

Sensornet
传感器网
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann
  • 通讯作者:
    Thomas Neumann
PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein
  • 通讯作者:
    M. Gerstein
Systems biology approach to integrative comparative genomics
综合比较基因组学的系统生物学方法
  • DOI:
    10.1586/14789450.4.1.107
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Jimmy Lin;Jiang Qian
  • 通讯作者:
    Jiang Qian
A Machine Learner’s Guide to Streamflow Prediction
机器学习者的水流预测指南
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Gauch;D. Klotz;Frederik Kratzert;G. Nearing;Sepp Hochreiter;Jimmy Lin
  • 通讯作者:
    Jimmy Lin
Structural Genomics Analysis : Phylogenetic Patterns of Unique , Shared , and Common Folds in 20 Genomes
结构基因组分析:20个基因组中独特、共享和共同折叠的系统发育模式
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    0
  • 作者:
    H. Hegyi;Jimmy Lin;M. Gerstein
  • 通讯作者:
    M. Gerstein

Jimmy Lin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jimmy Lin', 18)}}的其他基金

Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
  • 批准号:
    1444666
  • 财政年份:
    2014
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
  • 批准号:
    1218043
  • 财政年份:
    2012
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
EAGER: Learning to Efficiently Rank with Cascades
EAGER:学习使用级联进行有效排名
  • 批准号:
    1144034
  • 财政年份:
    2011
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant
DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
  • 批准号:
    1018625
  • 财政年份:
    2010
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
  • 批准号:
    0916043
  • 财政年份:
    2009
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
  • 批准号:
    0957954
  • 财政年份:
    2009
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
  • 批准号:
    0836560
  • 财政年份:
    2008
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant

相似国自然基金

M-Fe(CN)6 MOFs共催化介导的CRISPR微流控传感器一体化检测抗生素耐药基因及其宿主的应用研究
  • 批准号:
    82373635
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
CN725425在哺乳动物精子发生中的调控功能机制研究
  • 批准号:
    32300459
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
膜整联蛋白β8入核调控En1-SP1磷酸化在硬腭黏膜无瘢痕愈合中的作用研究
  • 批准号:
    82370928
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
SOX4/NF-kB p65/MGMT信号轴介导海星皂苷CN-3提高耐药胶质瘤化疗敏感性的机制研究
  • 批准号:
    82304782
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
向心性动态收缩水凝胶缓释P17抑制EN1基因激活在无瘢痕愈合中的应用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Conference: GAeL XXXI (Geometrie Algebrique en Liberte)
会议:GAeL XXXI(自由几何代数)
  • 批准号:
    2408333
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
複雑系混相燃焼物理の単成分燃料破裂燃焼への展開 ~CN燃料からHR燃料まで~
从复杂的多相燃烧物理发展到单组分燃料爆裂燃烧〜从CN燃料到HR燃料〜
  • 批准号:
    24K01081
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Creating and Sustaining Noyce Mentors en la Frontera: a HSI Collaborative Capacity Building Grant
在拉弗龙特拉创建和维持诺伊斯导师:HSI 协作能力建设补助金
  • 批准号:
    2345011
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
CN実現のための軽量マルチマテリアル輸送車体用高耐損傷性革新的異材接合技術の開発
开发创新的高抗损伤异种材料连接技术,用于轻量化多材料运输车车身,实现 CN
  • 批准号:
    23K22634
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Planification de l'analyse contextuelle de la collecte de données équitables dans les dossiers médicaux et de santé électroniques au Québec
魁北克医疗和电子档案收集的唐尼斯和电子档案的背景分析计划
  • 批准号:
    487913
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Miscellaneous Programs
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了