Collaborative Research: OAC Core: Robust, Scalable, and Practical Low Rank Approximation

合作研究:OAC 核心:稳健、可扩展且实用的低阶近似

基本信息

  • 批准号:
    2106738
  • 负责人:
  • 金额:
    $ 27.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-07-15 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

Nearly all aspects of society are affected by data being produced at a faster rate in recent years. The data from experiments, observations, and simulations are not only in more classical science and engineering domains but also in numerous other areas such as businesses tracking more and more facets of consumer behavior, and social networking capturing vast amounts of information on the relationships between people and their actions and interactions. There is a strong need to distill a set of data into a smaller representation that separates useful information from noise and captures the most important trends, patterns, and underlying relationships.  Such a representation can be used for direct interpretation of hidden patterns or as a means of simplifying other data analytic tasks.  This project addresses these challenges by studying a concept from linear algebra called low rank approximation.  The project develops techniques that faithfully distill the meaningful information within a data set.  The algorithms are also designed to exploit high-performance computers so that analysts can get results more quickly and tackle larger problems.  The overall effort in the project is expected to close the gap between algorithms that can effectively handle very large-scale problems and the data analyst’s ability to convert raw input into meaningful representations and actionable insight.The matrix and tensor low rank approximations being studied in this project serve as foundational tools in numerous science and engineering applications. Imposing constraints on the low rank approximations enables the modeling of many key problems, and designing scalable algorithms enables new applications that reach far beyond classical science and engineering disciplines. In particular, mathematical models with nonnegative data values abound, and imposing nonnegative constraints allows for more accurate and interpretable models. Variants of these constraints can be designed to reflect additional characteristics of real-life data analytics problems. The primary goals of this project are (1) to develop robust techniques for evaluating computed low rank approximations for rank and model determination, (2) to develop scalable parallel algorithms for large and robust low rank approximations on today’s extreme-scale machines, and (3) to provide end users the practical tools required to compute and analyze solutions at scale. Typical data and application scientists use Python or Matlab to iteratively compute, visualize, and evaluate solutions, and they are limited to small data sets with feasible memory and computational requirements. While high-performance algorithms and implementations exist, end users would not leverage these tools if they cannot rely on the robustness and generalizability of the results. This project aims to close this gap, developing an end-to-end system with scalable solutions for all steps of the data analytics workflow.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,社会几乎所有方面都受到更快的数据的影响。来自实验,观察和模拟的数据不仅在更古典的科学和工程领域中,而且在许多其他领域(例如企业跟踪越来越多的消费者行为方面),以及社交网络捕获有关人们及其行动和互动之间关系的大量信息。非常需要将一组数据提炼成较小的表示,该数据将有用的信息与噪声分开,并捕获最重要的趋势,模式和基本关系。这种表示形式可用于直接解释隐藏模式或简化其他数据分析任务的手段。该项目通过研究一个称为低等级近似的线性代数的概念来解决这些挑战。该项目开发了完全不同的数据集中有意义信息的技术。该算法还旨在探索高性能计算机,以便分析师可以更快地获得结果并解决更大的问题。预计该项目中的总体努力将弥合算法之间的差距,这些算法可以有效地处理非常大规模的问题,以及数据分析师将原始输入转换为有意义的表示和可行的见解的能力。在该项目中,矩阵和张量低级别近似值在众多科学和工程应用中都可以作为基础。对低等级近似的约束可以实现许多关键问题的建模,并且设计可扩展的算法可以使新应用程序能够远远超出古典科学和工程学科。特别是,具有非负数据值的数学模型充斥着,并施加非负约束可以提供更准确和可解释的模型。可以设计这些约束的变体以反映该项目的主要目标的其他特征是(1),以开发可靠的级别和模型确定的计算低等级近似值的强大技术,(2)以在当今的极端尺度机器上为当今的极端尺度机器和(3)提供量表和分析的实用工具,以开发大型且强大的低等级近似值的可扩展平行算法,以便提供实践的范围。典型的数据和应用科学家使用Python或Matlab迭代计算,可视化和评估解决方案,并且仅限于具有可行的内存和计算要求的小型数据集。尽管存在高性能算法和实现,但如果最终用户不能依赖结果的稳健性和普遍性,则不会利用这些工具。该项目旨在缩小这一差距,开发一个针对数据分析工作流程的所有步骤的端到端系统。该奖项反映了NSF的法定任务,并通过使用基金会的知识分子和更广泛的影响审查标准来通过评估来诚实地获得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Haesun Park其他文献

Unfolding Latent Tree Structures using 4th Order Tensors
使用四阶张量展开潜在树结构
A Dynamic Data Driven Application System for Vehicle Tracking
用于车辆跟踪的动态数据驱动应用系统
  • DOI:
    10.1016/j.procs.2014.05.108
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    R. Fujimoto;Angshuman Guin;M. Hunter;Haesun Park;G. Kanitkar;R. Kannan;Michael Milholen;Sabra A. Neal;P. Pecher
  • 通讯作者:
    P. Pecher
GPS-Based Shortest-Path Routing Scheme in Mobile Ad Hoc Network
移动Ad Hoc网络中基于GPS的最短路径路由方案
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Haesun Park;Soo;So;Joo
  • 通讯作者:
    Joo
A Comparison of Unsupervised Dimension Reduction Algorithms for Classification
用于分类的无监督降维算法的比较
The Organizational Factors Influencing Socially Responsible Apparel Buying/Sourcing
影响社会责任服装购买/采购的组织因素

Haesun Park的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Haesun Park', 18)}}的其他基金

SI2-SSE: Collaborative Research: High Performance Low Rank Approximation for Scalable Data Analytics
SI2-SSE:协作研究:可扩展数据分析的高性能低秩近似
  • 批准号:
    1642410
  • 财政年份:
    2016
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
CAREER: New Representations of Probability Distributions to Improve Machine Learning --- A Unified Kernel Embedding Framework for Distributions
职业:改进机器学习的概率分布的新表示——统一的分布内核嵌入框架
  • 批准号:
    1350983
  • 财政年份:
    2014
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Continuing Grant
EAGER: Hierarchical Topic Modeling by Nonnegative Matrix Factorization for Interactive Multi-scale Analysis of Text Data
EAGER:通过非负矩阵分解进行分层主题建模,用于文本数据的交互式多尺度分析
  • 批准号:
    1348152
  • 财政年份:
    2013
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
EAGER: Fast and Accurate Nonnegative Tensor Decompositions: Algorithms and Software
EAGER:快速准确的非负张量分解:算法和软件
  • 批准号:
    0956517
  • 财政年份:
    2009
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
FODAVA-Lead: Dimension Reduction and Data Reduction: Foundations for Visualization
FODAVA-Lead:降维和数据缩减:可视化的基础
  • 批准号:
    0808863
  • 财政年份:
    2008
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Continuing Grant
MSPA-MCS: Collaborative Research: Fast Nonnegative Matrix Factorizations: Theory, Algorithms, and Applications
MSPA-MCS:协作研究:快速非负矩阵分解:理论、算法和应用
  • 批准号:
    0732318
  • 财政年份:
    2007
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
SGER: Effective Network Anomaly Detection Based on Adaptive Machine Learning
SGER:基于自适应机器学习的有效网络异常检测
  • 批准号:
    0715342
  • 财政年份:
    2007
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
Collaborative Research: Greedy Approximations with Nonsubmodular Potential Functions
协作研究:具有非子模势函数的贪婪近似
  • 批准号:
    0728812
  • 财政年份:
    2007
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
CompBio: Collaborative Research: Development of Effective Gene Selection Algorithms for Microarray Data Analysis
CompBio:合作研究:开发用于微阵列数据分析的有效基因选择算法
  • 批准号:
    0621889
  • 财政年份:
    2006
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Continuing Grant
Special Meeting: Workshop on Future Direction in Numerical Algorithms and Optimization
特别会议:数值算法与优化未来方向研讨会
  • 批准号:
    0633793
  • 财政年份:
    2006
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant

相似国自然基金

支持二维毫米波波束扫描的微波/毫米波高集成度天线研究
  • 批准号:
    62371263
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
腙的Heck/脱氮气重排串联反应研究
  • 批准号:
    22301211
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
水系锌离子电池协同性能调控及枝晶抑制机理研究
  • 批准号:
    52364038
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于人类血清素神经元报告系统研究TSPYL1突变对婴儿猝死综合征的致病作用及机制
  • 批准号:
    82371176
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FOXO3 m6A甲基化修饰诱导滋养细胞衰老效应在补肾法治疗自然流产中的机制研究
  • 批准号:
    82305286
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403312
  • 财政年份:
    2024
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC CORE: Federated-Learning-Driven Traffic Event Management for Intelligent Transportation Systems
合作研究:OAC CORE:智能交通系统的联邦学习驱动的交通事件管理
  • 批准号:
    2414474
  • 财政年份:
    2024
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Learning AI Surrogate of Large-Scale Spatiotemporal Simulations for Coastal Circulation
合作研究:OAC Core:学习沿海环流大规模时空模拟的人工智能替代品
  • 批准号:
    2402947
  • 财政年份:
    2024
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403313
  • 财政年份:
    2024
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Large-Scale Spatial Machine Learning for 3D Surface Topology in Hydrological Applications
合作研究:OAC 核心:水文应用中 3D 表面拓扑的大规模空间机器学习
  • 批准号:
    2414185
  • 财政年份:
    2024
  • 资助金额:
    $ 27.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了