EAGER: Scalable Big Data Analytics
EAGER:可扩展的大数据分析
基本信息
- 批准号:1343639
- 负责人:
- 金额:$ 30万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-09-01 至 2016-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Big Data analytics requires bridging the gap between data-intensive computing and data-driven computing to obtain actionable insights. The former has primarily focused on optimizing data movement, reuse, organization and storage, while the latter has focused on hypothesis-driven, bottom-up data-to-discovery and the two fields have evolved somewhat independently. This exploratory project aims to investigate a holistic Ecosystem that optimizes data generation from simulations, sensors, or business processes (Transaction Step); organizes this data (possibly combining with other data) to enable reduction, pre-processing for downstream data analysis (Organization Step); performs knowledge discovery, learning and mining models from this data (Prediction Step); and leads to actions (e.g., refining models, new experiments, recommendation) (Feedback Step). Intellectual Merit: As opposed to the current practice of considering optimizations in each step in isolation, the project considers scalability and optimizations of the entire Ecosystem for big data analytics as part of the design strategy. The project aims to consider big data challenges in designing algorithms, software, analytics, and data management. This strategy contrasts with traditional approaches that first design algorithms for small data sizes and then scale them up. The project aims to treat data complexity, computational requirement, and data access patterns as a whole when designing and implementing algorithms, software and applications. Broader Impacts: The project could advance the state of the art in big data analytics across a number of key applications such as Climate Informatics and Social Media Analytics. The software resulting from the project is being made available to the broder scientific community under open source license. The project offers enhanced opportunities for education and training of graduate students and postdoctoral researchers at Northwestern University.
大数据分析需要弥合数据密集型计算和数据驱动计算之间的差距,以获得可行的见解。前者主要专注于优化数据移动,重复使用,组织和存储,而后者则集中在假设驱动的,自下而上的数据之间,并且这两个领域已经独立发展。该探索性项目旨在研究一个整体生态系统,该系统从模拟,传感器或业务流程(交易步骤)中优化数据生成;组织这些数据(可能与其他数据结合)以减少,预处理以进行下游数据分析(组织步骤);从此数据(预测步骤)中执行知识发现,学习和采矿模型;并导致行动(例如,精炼模型,新实验,建议)(反馈步骤)。智力优点:与当前考虑在每个步骤中进行优化的实践相反,该项目考虑了整个生态系统对大数据分析的可扩展性和优化,这是设计策略的一部分。该项目旨在考虑设计算法,软件,分析和数据管理方面的大数据挑战。该策略与传统方法对形成对比,该方法首先设计了针对小数据大小的算法,然后将其扩展。该项目旨在在设计和实施算法,软件和应用程序时将数据复杂性,计算需求以及数据访问模式整体处理。更广泛的影响:该项目可以在许多关键应用程序(例如气候信息学和社交媒体分析)等许多关键应用程序中提高最新技术状态。该项目产生的软件已根据开源许可提供给Broder科学界。该项目为西北大学的研究生和博士后研究人员提供了增强的教育和培训机会。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Alok Choudhary其他文献
Accelerating Data Mining Workloads: Current Approaches and Future Challenges in System Architecture Design
加速数据挖掘工作负载:系统架构设计的当前方法和未来挑战
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
J. Pisharath;†. JosephZambreno;Berkin ¨Ozıs.;†. ıkyılmaz;Alok Choudhary - 通讯作者:
Alok Choudhary
College of Engineering and ComputerScience 1-1-1994 PASSION Runtime Library for Parallel I / O
工程与计算机科学学院 1-1-1994 PASSION 并行 I/O 运行时库
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Rajeev Thakur;R. Bordawekar;Alok Choudhary;R. Ponnusamy;Rajeev Thakur;R. Bordawekar;Tarvinder Singh - 通讯作者:
Tarvinder Singh
Alok Choudhary的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Alok Choudhary', 18)}}的其他基金
EAGER: XAISE: Explainable Artificial Intelligence for Science and Engineering
EAGER:XAISE:科学与工程领域的可解释人工智能
- 批准号:
2331329 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
SHF: Medium: Collaborative Research: Scalable Algorithms for Spatio-temporal Data Analysis
SHF:中:协作研究:时空数据分析的可扩展算法
- 批准号:
1409601 - 财政年份:2014
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
EAGER: Discovering Knowledge from Scientific Research Networks
EAGER:从科学研究网络中发现知识
- 批准号:
1144061 - 财政年份:2011
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Travel Support for Workshop: Reaching Exascale in this Decade to be Co-Located with International Conference on High-Performance Computing (HiPC 2010)
研讨会差旅支持:在这十年内达到百亿亿次规模,与高性能计算国际会议 (HiPC 2010) 同期举办
- 批准号:
1043085 - 财政年份:2010
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: An Application Driven I/O Optimization Approach for PetaScale Systems and Scientific Discoveries
协作研究:针对 PetaScale 系统和科学发现的应用驱动 I/O 优化方法
- 批准号:
0938000 - 财政年份:2010
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: Understanding Climate Change: A Data Driven Approach
合作研究:了解气候变化:数据驱动的方法
- 批准号:
1029166 - 财政年份:2010
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Collaborative Research: CT-M: Hardware Containers for Software Components - Detection and Recovery at the Hardware/Software Interface
合作研究:CT-M:软件组件的硬件容器 - 硬件/软件接口的检测和恢复
- 批准号:
0830927 - 财政年份:2009
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
DC: Medium: Collaborative Research: ELLF: Extensible Language and Library Frameworks for Scalable and Efficient Data-Intensive Applications
DC:媒介:协作研究:ELLF:用于可扩展且高效的数据密集型应用程序的可扩展语言和库框架
- 批准号:
0905205 - 财政年份:2009
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Data- and Analytics Driven Fault-tolerance and Resiliency Strategies for Peta-Scale Systems
数据和分析驱动的千万亿级系统容错和弹性策略
- 批准号:
0956311 - 财政年份:2009
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: Advanced Compiler Optimizations and Programming Language Enhancements for Petascale I/O and Storage
协作研究:针对 Petascale I/O 和存储的高级编译器优化和编程语言增强
- 批准号:
0833131 - 财政年份:2008
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
相似国自然基金
基于可扩展去蜂窝架构的大规模低时延高可靠通信研究
- 批准号:62371039
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
区块链系统中面向业务优化的混合状态验证机制的可扩展性研究
- 批准号:62302202
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于可扩展功能单元的液晶软驱动机械超材料研究
- 批准号:52373173
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向二氧化碳封存的高可扩展时空并行区域分解算法及其大规模应用
- 批准号:12371366
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
可变扩散系数非局部问题的分布式可扩展的有限元并行计算方法
- 批准号:12301496
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
OAC Core: A Scalable and Deployable Container Orchestration Cyber Infrastructure Toolkit for Deploying Big Data Analytics Applications in Public Cloud
OAC Core:用于在公共云中部署大数据分析应用程序的可扩展和可部署的容器编排网络基础设施工具包
- 批准号:
2313738 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CICI: TCR: Improving the Robustness of Cyberinfrastructure via Scalable Vulnerability Discovery and Mitigation on "Big Binaries"
CICI:TCR:通过“大型二进制文件”的可扩展漏洞发现和缓解来提高网络基础设施的稳健性
- 批准号:
2232915 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
PED-PHAM: An Automated and Scalable Spatial Tool That Predicts and Monetizes Health Impacts of the Built, Natural, and Social Environment
PED-PHAM:一种自动化且可扩展的空间工具,可预测建筑、自然和社会环境对健康的影响并从中获利
- 批准号:
10761396 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Fingerprinting and Big Data Security Analytics for the Scalable Generation of Cyber Threat Intelligence
用于可扩展生成网络威胁情报的指纹识别和大数据安全分析
- 批准号:
RGPIN-2017-06650 - 财政年份:2022
- 资助金额:
$ 30万 - 项目类别:
Discovery Grants Program - Individual
OAC Core: A Scalable and Deployable Container Orchestration Cyber Infrastructure Toolkit for Deploying Big Data Analytics Applications in Public Cloud
OAC Core:用于在公共云中部署大数据分析应用程序的可扩展和可部署的容器编排网络基础设施工具包
- 批准号:
2212256 - 财政年份:2022
- 资助金额:
$ 30万 - 项目类别:
Standard Grant