THOR: A New Programming Model for Data Analysis and Mining
THOR:数据分析和挖掘的新编程模型
基本信息
- 批准号:0833136
- 负责人:
- 金额:$ 68.66万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2008
- 资助国家:美国
- 起止时间:2008-09-01 至 2012-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Virtually every human endeavor in a broad variety of disciplines in science, engineering, and finance, is encountering the need to make new discoveries through the analysis of massive datasets. Yet, the task of creating the necessary scalable analysis tools for modern high-performance parallel hardware is a daunting task, due to the complexity of developing efficient algorithms and subsequently having to parallelize and tune these algorithms for real systems. This research project aims to address this problem by developing a new domain-specific programming model, called the Tree-based High-Order Reduce (THOR) model, that enables rapid automatic implementation of customized parallel data analysis and mining tasks with minimal coding effort.The key enabling insight behind THOR is the generalized n-body problem (GNP) theory, a mathematical formalism that unifies the expression of seemingly disparate statistical data analysis tasks, including n-point correlation, hierarchical clustering, k-nearest neighbors classification, and kernel density estimation, among numerous others. As its name suggests, a GNP elegantly generalizes the classical n-body problem from physics to a much broader class of problems. Most importantly, the GNP form permits the development of asymptotically fast solutions, e.g., generalized versions of the fast multipole method. The THOR model enables the data analyst to specify a GNP, from which the THOR program generator can automatically produce a highly tuned parallel implementation. In short, this project aims to show how a programming model, which is bound to an appropriately high-level mathematical formalism while having the simplicity of a model like MapReduce, can lead to both scalable data analysis algorithms and their efficient implementation.
事实上,人类在科学、工程和金融等各个学科领域的每一项努力,都需要通过分析海量数据集来获得新发现。然而,由于开发高效算法以及随后必须针对实际系统并行化和调整这些算法的复杂性,为现代高性能并行硬件创建必要的可扩展分析工具的任务是一项艰巨的任务。该研究项目旨在通过开发一种新的特定于领域的编程模型(称为基于树的高阶归约(THOR)模型)来解决此问题,该模型能够以最少的编码工作快速自动实现定制的并行数据分析和挖掘任务。 THOR 背后的关键洞察力是广义 n 体问题 (GNP) 理论,这是一种数学形式主义,统一了看似不同的统计数据分析任务的表达,包括 n 点相关性、层次聚类、k 最近邻分类和核密度估计,其中众多 其他的。顾名思义,GNP 优雅地将经典的 n 体问题从物理学推广到更广泛的问题。最重要的是,GNP 形式允许开发渐进快速解决方案,例如快速多极子方法的广义版本。 THOR 模型使数据分析师能够指定 GNP,THOR 程序生成器可以根据该 GNP 自动生成高度调整的并行实现。简而言之,该项目旨在展示编程模型如何能够实现可扩展的数据分析算法及其高效实现,该模型与适当的高级数学形式绑定,同时具有 MapReduce 等模型的简单性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Richard Vuduc其他文献
Multifidelity Memory System Simulation in SST
SST 中的多保真内存系统仿真
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Patrick Lavin;Jeffrey Young;Richard Vuduc - 通讯作者:
Richard Vuduc
Modeling the Power Variability of Core Speed Scaling on Homogeneous Multicore Systems
对同质多核系统上核心速度调节的功率变化进行建模
- DOI:
10.1155/2017/8686971 - 发表时间:
2017-10 - 期刊:
- 影响因子:0
- 作者:
Zhihui Du;Rong Ge;Victor W. Lee;Richard Vuduc;David A. Bader;Ligang He - 通讯作者:
Ligang He
Sparse Matrix-Vector Multiplication on Multicore and Accelerators
多核和加速器上的稀疏矩阵向量乘法
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
Samuel Williams;Nathan Bell;Jee Whan Choi;Michael Garland;L. Oliker;Richard Vuduc - 通讯作者:
Richard Vuduc
Richard Vuduc的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Richard Vuduc', 18)}}的其他基金
XPS: FULL: DSD: A Parallel Tensor Infrastructure (ParTI!) for Data Analysis
XPS:完整:DSD:用于数据分析的并行张量基础设施 (PartTI!)
- 批准号:
1533768 - 财政年份:2015
- 资助金额:
$ 68.66万 - 项目类别:
Standard Grant
SHF: Small: How Much Execution Time, Energy, And Power Does an Algorithm Need?
SHF:小:算法需要多少执行时间、能量和功率?
- 批准号:
1422935 - 财政年份:2014
- 资助金额:
$ 68.66万 - 项目类别:
Standard Grant
SHF: Small: Locating and Explaining Faults in Concurrent Software
SHF:小:并发软件中的故障定位和解释
- 批准号:
1116210 - 财政年份:2011
- 资助金额:
$ 68.66万 - 项目类别:
Standard Grant
CAREER: Autotuning Foundations for Exascale Computing
职业:百亿亿次计算的自动调整基础
- 批准号:
0953100 - 财政年份:2010
- 资助金额:
$ 68.66万 - 项目类别:
Continuing Grant
相似国自然基金
基于二元重编程的归一化肿瘤疫苗在局部晚期三阴乳腺癌新辅助治疗中的作用与机制研究
- 批准号:32371451
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
新蛋白cEPB41L5-260aa通过调控组蛋白H4K8la乳酸化修饰促进肝癌代谢重编程的机制研究
- 批准号:82303220
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
“SDE miRNAs—FA代谢重编程”多靶点调控网络:CHB脾虚湿热证的生物学基础及方药干预的新靶标
- 批准号:82204956
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
一个新的抑癌基因ZBTB1在三阴乳腺癌代谢重编程与化疗抗性中的作用及其机制研究
- 批准号:
- 批准年份:2022
- 资助金额:32 万元
- 项目类别:地区科学基金项目
聚焦PKM2/HIF-1α轴调控巨噬细胞代谢重编程探讨新加白头翁汤干预溃疡性结肠炎的作用机制
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
SHF: SMALL: A New Semantics for Type-Level Programming in Haskell
SHF:SMALL:Haskell 中类型级编程的新语义
- 批准号:
2345580 - 财政年份:2024
- 资助金额:
$ 68.66万 - 项目类别:
Standard Grant
Programming of Resident Macrophages by the Brain Environment Following Transplantation
移植后大脑环境对常驻巨噬细胞的编程
- 批准号:
10790219 - 财政年份:2023
- 资助金额:
$ 68.66万 - 项目类别:
Discovering clinical endpoints of toxicity via graph machine learning and semantic data analysis
通过图机器学习和语义数据分析发现毒性的临床终点
- 批准号:
10745593 - 财政年份:2023
- 资助金额:
$ 68.66万 - 项目类别:
Democratizing CAR T cell therapy by in situ programming of virus-specific T cells
通过病毒特异性 T 细胞的原位编程使 CAR T 细胞疗法大众化
- 批准号:
10739646 - 财政年份:2023
- 资助金额:
$ 68.66万 - 项目类别:
The Evolutionary Basis of the Developmental Course and Etiologies of Anxiety and Disruptive Behaviors during Early Adolescence
青春期早期焦虑和破坏性行为的发展过程和病因的进化基础
- 批准号:
10737103 - 财政年份:2023
- 资助金额:
$ 68.66万 - 项目类别: