EAGER: AF:Small: Algorithms for Relational Machine Learning
EAGER:AF:Small:关系机器学习算法
基本信息
- 批准号:2036077
- 负责人:
- 金额:$ 14.88万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2023-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Relational database-management systems constitute a mature, ubiquitous, sophisticated technology that is deeply entrenched. Seemingly all organizations are collecting vastly increasing volumes of structured as well as unstructured data, and want to extract knowledge from this data using machine-learning techniques/algorithms. Thus many learning tasks faced by working data scientists involve relational data. Thus a marriage of machine learning and relational databases seems inevitable. However, standard machine-learning algorithms are not designed to operate directly on relational data, and further, it is far from obvious if and how one can adapt many of these algorithms to work on relational data without suffering a significant loss of efficiency. The current standard practice for a data scientist, confronted with a machine-learning task on relational data, is to issue a feature-extraction query to extract the (carefully curated) data from the relational database by joining together multiple tables to create a design matrix, and then to import this design matrix into some machine-learning tool to train the model. This standard practice is wasteful because (1) computing relational joins is computationally expensive, both in terms of time and space, (2) the resulting design matrix will likely contain much redundant information and consume much more space than the original tables, and thus (3) the machine-learning task takes more time than should conceptually be necessary. Algorithms that are orders of magnitude faster for standard machine-learning problems on relational data are certain to exist, and the goal of this research program is to discover them. Such algorithms would allow the extraction of information from data that is now not currently feasibly extractable.The research goals of this project are threefold. The first goal is to design and analyze relational algorithms for common machine-learning queries. A relational algorithm works directly on the relational data, without forming the design matrix, and can be orders of magnitude faster than standard machine-learning practice for such data. The second goal is to design a layer of relational algorithms for commonly arising subproblems and that can be utilized by the data scientists as a sort of middleware toolkit when designing their algorithms. The third goal is to build some intuition as to what problems are, and are not, solvable by relational algorithms and that researchers/practitioners can rely on when faced with a new problem. These goals will require the development of new algorithmic-design and -analysis techniques.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
关系数据库管理系统构成了一种成熟的、无处不在的、复杂的、根深蒂固的技术。 似乎所有组织都在收集越来越多的结构化和非结构化数据,并希望使用机器学习技术/算法从这些数据中提取知识。 因此,工作数据科学家面临的许多学习任务都涉及关系数据。 因此,机器学习和关系数据库的结合似乎是不可避免的。 然而,标准机器学习算法并不是为直接对关系数据进行操作而设计的,而且,是否以及如何使这些算法中的许多算法能够在不显着降低效率的情况下处理关系数据还远非显而易见。 数据科学家在面对关系数据的机器学习任务时,当前的标准做法是发出特征提取查询,通过将多个表连接在一起创建设计矩阵,从关系数据库中提取(精心策划的)数据,然后将此设计矩阵导入到某些机器学习工具中来训练模型。 这种标准做法是浪费的,因为(1)计算关系连接在时间和空间方面的计算成本都很高,(2)生成的设计矩阵可能包含很多冗余信息,并且比原始表消耗更多的空间,因此( 3)机器学习任务花费的时间超出了概念上所需的时间。 对于关系数据上的标准机器学习问题来说,速度快几个数量级的算法肯定是存在的,本研究项目的目标就是发现它们。 此类算法将允许从目前无法提取的数据中提取信息。该项目的研究目标有三个。 第一个目标是设计和分析常见机器学习查询的关系算法。关系算法直接作用于关系数据,无需形成设计矩阵,并且可以比此类数据的标准机器学习实践快几个数量级。 第二个目标是为常见的子问题设计一层关系算法,数据科学家在设计算法时可以将其用作中间件工具包。 第三个目标是建立一些直觉,了解哪些问题可以通过关系算法解决,哪些问题不能通过关系算法解决,并且研究人员/从业人员在面对新问题时可以依赖这些直觉。 这些目标将需要开发新的算法设计和分析技术。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Relational Gradient Descent Algorithm For Support Vector Machine Training
支持向量机训练的关系梯度下降算法
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Abo Khamis, Mahmoud;Im, Sungjin;Moseley, Ben;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
Relational Algorithms for k-Means Clustering
k-Means 聚类的关系算法
- DOI:10.4230/lipics.icalp.2021.97
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Moseley, Benjamin;Pruhs, Kirk;Samadian, Alireza;Wang, Yuyan
- 通讯作者:Wang, Yuyan
Approximate Aggregate Queries Under Additive Inequalities
加性不等式下的近似聚合查询
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Abo Khamis, Mahmoud;Im, Sungjin;Moseley, Ben;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
Instance Optimal Join Size Estimation
实例最佳连接大小估计
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Abo Khamis, Mahmoud;Im, Sungjin;Moseley, Ben;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
An Approximation Algorithm for the Matrix Tree Multiplication Problem
矩阵树乘法问题的近似算法
- DOI:10.4230/lipics.mfcs.2021.6
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Abo Khamis, Mahmoud;Curtin, Ryan;Im, Sungjin;Moseley, Ben;Ngo, Hung;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kirk Pruhs其他文献
Kirk Pruhs的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kirk Pruhs', 18)}}的其他基金
AF:Small: Algorithmic Management of Heterogeneous Resources
AF:Small:异构资源的算法管理
- 批准号:
1907673 - 财政年份:2019
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AitF: EXPL: Data Management in Domain Wall Memory-based Scratchpad for High Performance Mobile Devices
AitF:EXPL:用于高性能移动设备的基于域墙内存的便签本中的数据管理
- 批准号:
1535755 - 财政年份:2015
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Algorithmic Energy Management in New Information Technologies
AF:小:新信息技术中的算法能源管理
- 批准号:
1421508 - 财政年份:2014
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
EAGER: A Framework for joint optimization of power management and performance in virtualized, heterogeneous cloud computing environments
EAGER:虚拟化异构云计算环境中电源管理和性能联合优化的框架
- 批准号:
1253218 - 财政年份:2012
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Green Computing Algorithmics
AF:小型:绿色计算算法
- 批准号:
1115575 - 财政年份:2011
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Algorithmic Support for Power Management
电源管理的算法支持
- 批准号:
0830558 - 财政年份:2008
- 资助金额:
$ 14.88万 - 项目类别:
Continuing Grant
Collaborative Research: Algorithmic Support for Power Aware Computing and Communication
协作研究:功耗感知计算和通信的算法支持
- 批准号:
0514058 - 财政年份:2005
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Algorithmic Support for Temperature Aware Computing and Networking
温度感知计算和网络的算法支持
- 批准号:
0448196 - 财政年份:2004
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
相似国自然基金
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
- 批准号:82370157
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
- 批准号:82303789
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
间充质干细胞微粒通过U2AF1负调控pDC活化改善系统性红斑狼疮的机制研究
- 批准号:82302029
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
- 批准号:82300739
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
- 批准号:32372727
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
AF:Small: Bayesian Estimation and Constraint Satisfaction
AF:Small:贝叶斯估计和约束满足
- 批准号:
2342192 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Structural Graph Algorithms via General Frameworks
合作研究:AF:小型:通过通用框架的结构图算法
- 批准号:
2347321 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402572 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Communication-Aware Algorithms for Dynamic Allocation of Heterogeneous Resources
AF:小型:用于异构资源动态分配的通信感知算法
- 批准号:
2335187 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant