EAGER: Hierarchical Topic Modeling by Nonnegative Matrix Factorization for Interactive Multi-scale Analysis of Text Data

EAGER:通过非负矩阵分解进行分层主题建模,用于文本数据的交互式多尺度分析

基本信息

  • 批准号:
    1348152
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-08-15 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

EAGER: Hierarchical Topic Modeling by Nonnegative Matrix Factorization for Interactive Multi-scale Analysis of Text DataNonnegative matrix factorization (NMF) has proven to be an important tool of choice for numerous data analytic problems in text, imaging, and computer vision. It provides advanced mathematical methods for improvements in dimensionality reduction, clustering, etc. A distinguishing feature of the NMF is the requirement of non-negativity in the factors that represent the matrix in a lower rank. This property greatly enhances the interpretability and modeling capability for many applications, where preserving non-negativity is important. This project is studying foundational properties of the NMF, producing new algorithmic methods using the framework of NMF for efficient and effective hierarchical clustering and topic modeling of large scale text data for multi-scale analysis, generating labels for the topics, and interactive analysis. In addition, an interactive visual analytic system for the proposed methods is being developed to make these theoretical and algorithmic discoveries readily available to the research and applications communities. New multi-scale hierarchical methods for generating clusters and discovering topics in the documents and detection of topic changes over time are being explored to enable computationally efficient and perceptually effective ways of exploring text data and discovering latent group structure. Visual analytic systems are also being developed based on this foundational work to enable more effective and informed discovery of topics in a large-scale document collection.This project will have a significant impact on the analysis and development of NMF algorithms and new modeling of problems for applications utilizing the NMF (e.g., 'Big Data'). The project is yielding effective computational methods with solid analysis that will enhance the analysis of high-dimensional data in broad areas of science, engineering, medicine, and business disciplines beyond the application areas being considered within this project.
EAGER:通过非负矩阵分解进行分层主题建模,用于文本数据的交互式多尺度分析非负矩阵分解(NMF)已被证明是文本、成像和计算机视觉中众多数据分析问题的重要选择工具。它为降维、聚类等方面的改进提供了先进的数学方法。NMF 的一个显着特征是要求代表较低阶矩阵的因子非负性。 此属性极大地增强了许多应用程序的可解释性和建模能力,在这些应用程序中,保持非负性非常重要。该项目正在研究 NMF 的基本特性,使用 NMF 框架产生新的算法方法,用于高效且有效的大规模文本数据的层次聚类和主题建模,以进行多尺度分析、为主题生成标签和交互式分析。 此外,正在开发针对所提出方法的交互式视觉分析系统,以使这些理论和算法发现易于研究和应用社区使用。正在探索用于生成聚类和发现文档中的主题以及检测主题随时间变化的新的多尺度分层方法,以实现探索文本数据和发现潜在组结构的计算高效和感知有效的方法。视觉分析系统也基于这项基础工作而开发,以便能够更有效、更明智地发现大规模文档集中的主题。该项目将对 NMF 算法的分析和开发以及新的问题建模产生重大影响。利用 NMF 的应用程序(例如“大数据”)。 该项目正在产生有效的计算方法和可靠的分析,这将增强对科学、工程、医学和商业学科广泛领域的高维数据的分析,超出了该项目所考虑的应用领域。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Haesun Park其他文献

TopicSifter: Interactive Search Space Reduction through Targeted Topic Modeling
TopicSifter:通过有针对性的主题建模减少交互式搜索空间
Command Generation Techniques for a Pin Array Using the SVD and the SNMF
使用 SVD 和 SNMF 的引脚阵列命令生成技术
  • DOI:
    10.3182/20120905-3-hr-2030.00072
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ryder C. Winck;Jingu Kim;W. Book;Haesun Park
  • 通讯作者:
    Haesun Park
Structured total least norm method for Toeplitz problems
Toeplitz 问题的结构化总最小范数法
VisIRR: Interactive Visual Information Retrieval and Recommendation for Large-scale Document Data
VisIRR:大规模文档数据的交互式视觉信息检索和推荐
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Choo;C. Lee;Edward Clarkson;Zhicheng Liu;Hanseung Lee;Duen Horng Chau;Fuxin Li;R. Kannan;Charles D. Stolper;D. Inouye;Nishant A. Mehta;H. Ouyang;Subhojit Som;Ale;er G. Gray;er;J. Stasko;Haesun Park
  • 通讯作者:
    Haesun Park
Surface analysis of sequential semi-solvent vapor impact (SAVI) for studying microstructural arrangements of poly(lactide-co-glycolide) microparticles.
连续半溶剂蒸气冲击 (SAVI) 的表面分析,用于研究聚丙交酯乙交酯微粒的微观结构排列。

Haesun Park的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Haesun Park', 18)}}的其他基金

Collaborative Research: OAC Core: Robust, Scalable, and Practical Low Rank Approximation
合作研究:OAC 核心:稳健、可扩展且实用的低阶近似
  • 批准号:
    2106738
  • 财政年份:
    2021
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
SI2-SSE: Collaborative Research: High Performance Low Rank Approximation for Scalable Data Analytics
SI2-SSE:协作研究:可扩展数据分析的高性能低秩近似
  • 批准号:
    1642410
  • 财政年份:
    2016
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CAREER: New Representations of Probability Distributions to Improve Machine Learning --- A Unified Kernel Embedding Framework for Distributions
职业:改进机器学习的概率分布的新表示——统一的分布内核嵌入框架
  • 批准号:
    1350983
  • 财政年份:
    2014
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
EAGER: Fast and Accurate Nonnegative Tensor Decompositions: Algorithms and Software
EAGER:快速准确的非负张量分解:算法和软件
  • 批准号:
    0956517
  • 财政年份:
    2009
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
FODAVA-Lead: Dimension Reduction and Data Reduction: Foundations for Visualization
FODAVA-Lead:降维和数据缩减:可视化的基础
  • 批准号:
    0808863
  • 财政年份:
    2008
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
SGER: Effective Network Anomaly Detection Based on Adaptive Machine Learning
SGER:基于自适应机器学习的有效网络异常检测
  • 批准号:
    0715342
  • 财政年份:
    2007
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
MSPA-MCS: Collaborative Research: Fast Nonnegative Matrix Factorizations: Theory, Algorithms, and Applications
MSPA-MCS:协作研究:快速非负矩阵分解:理论、算法和应用
  • 批准号:
    0732318
  • 财政年份:
    2007
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: Greedy Approximations with Nonsubmodular Potential Functions
协作研究:具有非子模势函数的贪婪近似
  • 批准号:
    0728812
  • 财政年份:
    2007
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CompBio: Collaborative Research: Development of Effective Gene Selection Algorithms for Microarray Data Analysis
CompBio:合作研究:开发用于微阵列数据分析的有效基因选择算法
  • 批准号:
    0621889
  • 财政年份:
    2006
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Special Meeting: Workshop on Future Direction in Numerical Algorithms and Optimization
特别会议:数值算法与优化未来方向研讨会
  • 批准号:
    0633793
  • 财政年份:
    2006
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant

相似国自然基金

面向复杂场景的非线性多智能体系统一致性分层控制与优化
  • 批准号:
    62303393
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于自分层结构的吸波涂层设计及吸波-耐腐蚀性能调控机制
  • 批准号:
    52372103
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
新泵控主驱/横拉杆辅控式多轴电液转向的精准轨迹跟踪机理与分层控制
  • 批准号:
    52375046
  • 批准年份:
    2023
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
二步分层李群上的Hardy不等式及相关问题研究
  • 批准号:
    12301145
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多源干扰下非同元次系统的复合分层控制及在永磁同步电机伺服系统的应用
  • 批准号:
    62303116
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Functional-unit-based hierarchical nanocomposites for sustainable future
基于功能单元的分层纳米复合材料促进可持续未来
  • 批准号:
    FT230100436
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    ARC Future Fellowships
Strategies for predicting functionality of polymer electrolyte membranes based on dynamics and hierarchical structures
基于动力学和分层结构的聚合物电解质膜功能预测策略
  • 批准号:
    24K08091
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: RUI: Wave Engineering in 2D Using Hierarchical Nanostructured Dynamical Systems
合作研究:RUI:使用分层纳米结构动力系统进行二维波浪工程
  • 批准号:
    2337506
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: An Integrated Framework for Learning-Enabled and Communication-Aware Hierarchical Distributed Optimization
协作研究:支持学习和通信感知的分层分布式优化的集成框架
  • 批准号:
    2331711
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Deciphering and Directing Hierarchical Self-Assembly in Hybrid Chiral Films
破译和指导混合手性薄膜中的分层自组装
  • 批准号:
    2344586
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了