Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Foundations, Capabilities, and Applications

协作研究:数据挖掘的非负矩阵分解:基础、功能和应用

基本信息

  • 批准号:
    0915228
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

Nonnegative matrix factorization (NMF) factorizes an input nonnegative matrix into two nonnegative matrices of lower rank. It was recently discovered that NMF has unique ability to solve challenging data mining and machine learning problems. The advantage of NMF over existing unsupervised learning methods are (1) NMF can model widely varying data distributions, (2) NMF performs both hard and soft clustering simultaneously. (3) Many other data mining problems such as semi-supervised clustering problems can be reformulated as NMF problem. Building upon these foundations, the investigators propose to establish a NMF-based comprehensive framework for data mining: (a) Provide deeper understanding of NMF's clustering capability;(b) Extend data mining capability of NMF for solving various data mining and machine learning problems; (c) Develop fast numerical algorithms which incorporate the state-of-the-art developments from numerical optimization for various matrix factorization models; (d) Develop novel and rigorous proof strategies to prove the correctness and convergence properties of the numerical algorithms; (e) Apply and evaluate these new algorithms in real-world applications.The proposed work creates a new paradigm of analyzing vast amount of data and discovering new knowledge from the data by transforming established matrix computational methodologies. This new technology can automatically group news articles into meaningful categories, discover protein modules in protein networks, extract weather patterns in climate data, segment pictures into distinct objects, detect communities on the Web, and enable many other scientific discoveries and new technologies creation. On a fundamental level, the proposed work establishes that a simple matrix factorization in fact solves challenging data mining problems. This research reinforces the importance of mathematics in today's data centric world and encourages students to learn mathematics.
非负矩阵分解 (NMF) 将输入非负矩阵分解为两个较低秩的非负矩阵。最近发现 NMF 具有解决具有挑战性的数据挖掘和机器学习问题的独特能力。 与现有无监督学习方法相比,NMF 的优点是(1)NMF 可以对广泛变化的数据分布进行建模,(2)NMF 同时执行硬聚类和软聚类。 (3) 许多其他数据挖掘问题,例如半监督聚类问题,可以重新表述为 NMF 问题。在此基础上,研究人员建议建立一个基于 NMF 的数据挖掘综合框架:(a)加深对 NMF 聚类能力的理解;(b)扩展 NMF 的数据挖掘能力,以解决各种数据挖掘和机器学习问题; (c) 开发快速数值算法,其中纳入各种矩阵分解模型数值优化的最先进成果; (d) 制定新颖且严格的证明策略,以证明数值算法的正确性和收敛性; (e) 在现实世界应用中应用和评估这些新算法。所提出的工作创建了一种新的范式,通过改变已建立的矩阵计算方法来分析大量数据并从数据中发现新知识。这项新技术可以自动将新闻文章分组为有意义的类别,发现蛋白质网络中的蛋白质模块,提取气候数据中的天气模式,将图片分割成不同的对象,检测网络上的社区,并实现许多其他科学发现和新技术的创造。从根本上讲,所提出的工作证明简单的矩阵分解实际上可以解决具有挑战性的数据挖掘问题。这项研究强调了数学在当今以数据为中心的世界中的重要性,并鼓励学生学习数学。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chris Ding其他文献

Feature selection: We've barely scratched the surface
功能选择:我们仅仅触及了表面
  • DOI:
  • 发表时间:
    2005-11-01
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    George Forman;Huan Liu;Edward R. Dougherty;Jennifer G. Dy;Kari Torkkola;E. Tuv;Hanchuan Peng;Chris Ding;Fuhui Long;Michael E. Berens;Lance Parsons;Lei Yu;Zheng Zhao
  • 通讯作者:
    Zheng Zhao
Robust data representation using locally linear embedding guided PCA
使用局部线性嵌入引导 PCA 的稳健数据表示
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Bo Jiang;Chris Ding;Bin Luo
  • 通讯作者:
    Bin Luo
Non-greedy Max-min Large Margin based on L1-norm
基于L1范数的非贪婪最大最小大裕度
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    5.1
  • 作者:
    Sibao Chen;Chong Zuo;Chris Ding;Bin Luo
  • 通讯作者:
    Bin Luo
Double Robust Principal Component Analysis
双稳健主成分分析
  • DOI:
    10.1016/j.neucom.2020.01.097
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Qianqian Wang;QuanXue Gao;Gan Sun;Chris Ding
  • 通讯作者:
    Chris Ding
Revisiting L2,1-Norm Robustness With Vector Outlier Regularization
通过向量异常值正则化重新审视 L2,1-范数鲁棒性

Chris Ding的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chris Ding', 18)}}的其他基金

EAGER: Collaborative Research: Cross-Domain Knowledge Transformation via Matrix Decompositions
EAGER:协作研究:通过矩阵分解进行跨领域知识转换
  • 批准号:
    0939187
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
New Theoretical Foundations of Tensor Applications: Clustering, Error Analysis, Global Convergence, and Robust Formulations
张量应用的新理论基础:聚类、误差分析、全局收敛和鲁棒公式
  • 批准号:
    0917274
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Matrix-Model Machine Learning: Unifying Machine Learning and Scientific Computing
协作研究:矩阵模型机器学习:统一机器学习和科学计算
  • 批准号:
    0830780
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
SGER: Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Algorithms and Applications
SGER:协作研究:数据挖掘的非负矩阵分解:算法和应用
  • 批准号:
    0844497
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant

相似国自然基金

肝细胞因子ORM2通过抑制Kupffer细胞激活改善非酒精性脂肪性肝炎的作用及机制研究
  • 批准号:
    82300966
  • 批准年份:
    2023
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目
PKM2苏木化修饰调节非小细胞肺癌起始细胞介导的耐药生态位的机制研究
  • 批准号:
    82372852
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
人工智能技术加剧全球价值链非平衡发展的形成机理与中国对策研究
  • 批准号:
    72303127
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
非肽能感受器介导的穴区效应在推拿“以痛为腧”干预腰椎间盘突出症中的机制研究
  • 批准号:
    82305423
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
非刚性折叠超材料的设计理论和力学性能研究
  • 批准号:
    52373293
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Non-Linearity and Feedbacks in the Atmospheric Circulation Response to Increased Carbon Dioxide (CO2)
合作研究:大气环流对二氧化碳 (CO2) 增加的响应的非线性和反馈
  • 批准号:
    2335762
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Catholyte Molecular Design For Non-aqueous Mg-organic Hybrid Redox Flow Batteries
合作研究:非水镁有机混合氧化还原液流电池的阴极电解液分子设计
  • 批准号:
    2419938
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Non-Linearity and Feedbacks in the Atmospheric Circulation Response to Increased Carbon Dioxide (CO2)
合作研究:大气环流对二氧化碳 (CO2) 增加的响应的非线性和反馈
  • 批准号:
    2335761
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: New Phase Diagrams for Predictive Solvothermal Synthesis in Non-Aqueous Solvents
合作研究:非水溶剂中预测溶剂热合成的新相图
  • 批准号:
    2240282
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: Non-Parametric Inference of Temporal Data
合作研究:时态数据的非参数推理
  • 批准号:
    2311249
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了