XTRIPODS: Algorithms and Machine Learning in Data Intensive Models
XTRIPODS:数据密集型模型中的算法和机器学习
基本信息
- 批准号:2342527
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2024
- 资助国家:美国
- 起止时间:2024-02-15 至 2026-01-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Large datasets have emerged within numerous scientific disciplines, unveiling valuable insights and helping to develop various useful applications. However, they also pose several challenges due to their ever-growing size and dynamic nature. Often, these data sets are processed as data streams or distributed across multiple machines. Sketching and streaming algorithms have been successful in tackling many problems in these settings, ranging from data analysis, network algorithms, to optimization. One research objective of this project is to further improve these algorithms, in terms of time and memory efficiency, with the aid of machine learning predictions. This project will also apply sketching techniques to develop federated machine learning algorithms where data is distributed across machines or devices, offering privacy advantages due to their decentralized nature. The project also aims to improve the foundation of data science and computer science education at San Diego State University and in the community at large through collaboration with the TRIPODS EnCore Institute at UC San Diego.Unlike traditional worst-case analysis, by incorporating machine learning to unravel the underlying structure of the data, it becomes possible in many cases to design better algorithms. The investigator plans to improve the efficiency of existing sketching and streaming algorithms using machine learning. These improvements are in terms of space and time complexity as well as approximation quality. A wide range of problems in this paradigm including data summarization, graph theory, and combinatorial optimization will be considered. Additionally, the investigator plans to utilize sketching to aid the design of machine learning algorithms in distributed and federated settings. Data sketches offer several advantages for this task. They have a small memory footprint and can be merged to form a sketch of the combined data. Additionally, they reveal minimal information about local data, benefiting privacy. The investigator aims to employ sketching algorithms on various problems such as building boosted decision trees for classification and regression, and learning a Bayesian network to explain the data. The investigator will also develop new computer science courses at San Diego State University to improve data science education and collaborate with the TRIPODS EnCORE Institute at UC San Diego, to expand a summer boot camp for high school students focusing on data science.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
许多科学学科中都出现了大型数据集,揭示了有价值的见解并帮助开发各种有用的应用程序。然而,由于其不断增长的规模和动态性质,它们也带来了一些挑战。通常,这些数据集作为数据流进行处理或分布在多台机器上。草图和流算法已经成功地解决了这些设置中的许多问题,从数据分析、网络算法到优化。该项目的研究目标之一是借助机器学习预测,在时间和内存效率方面进一步改进这些算法。该项目还将应用草图技术来开发联合机器学习算法,其中数据分布在机器或设备上,由于其去中心化性质而提供隐私优势。该项目还旨在通过与加州大学圣地亚哥分校 TRIPODS EnCore 研究所合作,改善圣地亚哥州立大学和整个社区的数据科学和计算机科学教育基础。与传统的最坏情况分析不同,通过将机器学习融入到揭示数据的底层结构,在许多情况下可以设计出更好的算法。研究人员计划使用机器学习来提高现有草图和流算法的效率。这些改进体现在空间和时间复杂度以及近似质量方面。将考虑该范式中的各种问题,包括数据汇总、图论和组合优化。此外,研究人员计划利用草图来帮助设计分布式和联合环境中的机器学习算法。数据草图为此任务提供了多个优势。它们的内存占用很小,可以合并以形成组合数据的草图。此外,它们只透露有关本地数据的最少信息,有利于隐私。研究人员的目标是在各种问题上采用草图算法,例如构建用于分类和回归的增强决策树,以及学习贝叶斯网络来解释数据。研究人员还将在圣地亚哥州立大学开发新的计算机科学课程,以改善数据科学教育,并与加州大学圣地亚哥分校的 TRIPODS EnCORE 研究所合作,为专注于数据科学的高中生扩大夏令营。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Hoa Vu其他文献
AGPU モデルでの並列ソートアルゴリズムの計算量について
关于AGPU模型中并行排序算法的计算复杂度
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
小池 敦;定兼 邦彦;Hoa Vu - 通讯作者:
Hoa Vu
AGPU モデルでの並列ソートアルゴリズムの計算量について
关于AGPU模型中并行排序算法的计算复杂度
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
小池 敦;定兼 邦彦;Hoa Vu - 通讯作者:
Hoa Vu
Estimating Disturbance Torque Effects on the Stability and Control Performance of Two-Axis Gimbal Systems
估计扰动扭矩对两轴万向节系统稳定性和控制性能的影响
- DOI:
10.32603/1993-8985-2022-25-4-63-71 - 发表时间:
2022-09-29 - 期刊:
- 影响因子:0
- 作者:
Ngoc Hung Nguyen;Van Phan Do;Hoa Vu - 通讯作者:
Hoa Vu
Sparse Manifold Alignment
稀疏流形对齐
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Chang Wang;Bo Liu;Hoa Vu;S. Mahadevan - 通讯作者:
S. Mahadevan
LCT-MALTA’s Submission to RepEval 2017 Shared Task
LCT-MALTA 提交给 2017 年 RepEval 共享任务
- DOI:
10.18653/v1/w17-5311 - 发表时间:
2017-09-01 - 期刊:
- 影响因子:0
- 作者:
Hoa Vu - 通讯作者:
Hoa Vu
Hoa Vu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
用户友好型高效自适应的机器学习优化算法研究
- 批准号:62376125
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于机器学习和贝叶斯优化算法的药物结晶溶剂设计方法
- 批准号:22308228
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
分布式机器学习算法设计与理论分析
- 批准号:62376008
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
近期量子计算机与机器学习算法
- 批准号:92365117
- 批准年份:2023
- 资助金额:66 万元
- 项目类别:重大研究计划
基于机器学习算法的针刺干预偏头痛预后差异生物学机制和临床-多组学预测模型构建研究
- 批准号:82374572
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
- 批准号:
2422926 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
Development of a Novel EMG-Based Neural Interface for Control of Transradial Prostheses with Gripping Assistance
开发一种新型的基于肌电图的神经接口,用于通过抓取辅助控制经桡动脉假体
- 批准号:
10748341 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
CAREER: Gaussian Processes for Scientific Machine Learning: Theoretical Analysis and Computational Algorithms
职业:科学机器学习的高斯过程:理论分析和计算算法
- 批准号:
2337678 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
AF:RI:Small: Fairness in allocation and machine learning problems: algorithms and solution concepts
AF:RI:Small:分配公平性和机器学习问题:算法和解决方案概念
- 批准号:
2334461 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
- 批准号:
2337776 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant