III: Small: Integrating Casual Discovery and Feature Selection with Streaming Features

III:小:将休闲发现和特征选择与流媒体功能相结合

基本信息

项目摘要

With the advent of emerging massive datasets in image processing,biology, finance, and so on, traditional data mining systemsface new challenges to induce knowledge and discover causalrelations in dynamic streaming feature environments, where newfeatures continuously stream in over time. These challenges include(1) continuous growth of feature volumes over time, (2) a huge featurespace, even of unknown or infinite size, and (3) not all featuresbeing available before learning begins. These challenges call for anew learning paradigm with continuously increasing features. In thisproject, we take the increasing feature volumes as streaming features,and the corresponding learning problem is referred to as OnlineLearning with Streaming Features (OLSF). Since existing onlinelearning efforts mostly deal with data with increasing observationsbut fixed feature dimensions, OLSF provides a unique chance to unfoldand characterize pattern trends for dynamic systems with streamingfeatures.This project aims to address two fundamental issues for OLSF: (1)causal discovery with sequentially increasing feature dimensions; and(2) causal relations for feature selection. We design novel methodsand algorithms for causal discovery in OLSF and establish formal connectionsbetween casual discovery and feature selection by investigating themutual benefits between them in the context of online stream featurelearning. To evaluate the proposed research, we conduct empiricalstudies on a large body of benchmark datasets, as well as with adomain-specific real-world case study in personalized news filteringand summarization where the feature space changes over time. Thenew algorithms and techniques in this project will advance our abilityto discover knowledge from dynamic systems using streaming featureswith bounded resources. The spectrum of the methods from the projectwill not only enrich our knowledge and understanding of patterndiscovery and machine learning for dynamic systems, but also provide anew view to capture and characterize dynamic systems from a streamingfeature perspective.
随着图像处理、生物学、金融等领域新兴海量数据集的出现,传统数据挖掘系统面临着在动态流特征环境中引入知识和发现因果关系的新挑战,其中新特征随着时间的推移不断涌入。这些挑战包括(1)特征量随着时间的推移不断增长,(2)巨大的特征空间,甚至未知或无限大小,以及(3)在学习开始之前并非所有特征都可用。这些挑战需要具有不断增加功能的新学习范式。在这个项目中,我们将不断增加的特征量作为流特征,相应的学习问题被称为带有流特征的在线学习(OLSF)。由于现有的在线学习工作主要处理具有增加的观测值但特征维度固定的数据,OLSF 提供了一个独特的机会来展开和表征具有流特征的动态系统的模式趋势。该项目旨在解决 OLSF 的两个基本问题:(1)顺序增加的因果发现特征尺寸; (2)特征选择的因果关系。我们为 OLSF 中的因果发现设计了新颖的方法和算法,并通过研究在线流特征学习背景下偶然发现和特征选择之间的互惠关系,在偶然发现和特征选择之间建立了正式的联系。 为了评估所提出的研究,我们对大量基准数据集进行了实证研究,并对个性化新闻过滤和摘要中特定领域的现实世界案例研究进行了研究,其中特征空间随时间变化。 该项目中的新算法和技术将提高我们使用有限资源的流功能从动态系统中发现知识的能力。该项目的方法范围不仅将丰富我们对动态系统的模式发现和机器学习的知识和理解,而且还提供了从流特征角度捕获和表征动态系统的新视角。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xindong Wu其他文献

Conceptual equivalence for contrast mining in classification learning
分类学习中对比挖掘的概念等价
  • DOI:
    10.1016/j.datak.2008.07.001
  • 发表时间:
    2008-12
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    朱兴全;Ying Yang;Xindong Wu
  • 通讯作者:
    Xindong Wu
Employing Semantic Context for Sparse Information Extraction Assessment
利用语义上下文进行稀疏信息提取评估
Mining stable patterns in multiple correlated databases
在多个相关数据库中挖掘稳定模式
  • DOI:
    10.1016/j.dss.2013.06.003
  • 发表时间:
    2013-12
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    Yaojin Lin;Xuegang Hu;Xiaomei Li;Xindong Wu
  • 通讯作者:
    Xindong Wu
Harvesting data from advanced technologies.
  • DOI:
  • 发表时间:
    2014-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xindong Wu
  • 通讯作者:
    Xindong Wu
Intrusion Detection Models Based on Data Mining
基于数据挖掘的入侵检测模型

Xindong Wu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xindong Wu', 18)}}的其他基金

Support for US-Based Students to Attend the 2010 IEEE International Conference on Data Mining (ICDM 2010), December 13-17, 2010, Sydney, Australia
支持美国学生参加 2010 年 IEEE 国际数据挖掘会议 (ICDM 2010),2010 年 12 月 13-17 日,澳大利亚悉尼
  • 批准号:
    1049139
  • 财政年份:
    2010
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
CIF:Medium:Collaborative Research: Integrating and Mining Bio-Data from Multiple Sources in Biological Networks
CIF:Medium:协作研究:整合和挖掘生物网络中多个来源的生物数据
  • 批准号:
    0905337
  • 财政年份:
    2009
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Pattern Matching with Wildcards and Length Constraints
具有通配符和长度约束的模式匹配
  • 批准号:
    0514819
  • 财政年份:
    2005
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant

相似国自然基金

员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
  • 批准号:
    72372021
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
小整合膜蛋白SMIM24通过PON2介导的GLUT1质膜转位调控胃癌糖酵解和侵袭转移的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
整合深度学习和分子对接的RNA-小分子建模研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
整合素ITGB3促进PD-L1表达在非小细胞肺癌脊柱转移瘤治疗中的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
PNPT1及其小分子抑制剂在非小细胞肺癌整合应激反应中的功能和应用研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
  • 批准号:
    2311954
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Integrating Radiomics into S0819 and Lung-MAP, Biomarker Driven Clinical Trials for Lung Cancer
将放射组学整合到 S0819 和 Lung-MAP、生物标​​志物驱动的肺癌临床试验中
  • 批准号:
    10177883
  • 财政年份:
    2018
  • 资助金额:
    $ 49.79万
  • 项目类别:
Integrating Radiomics into S0819 and Lung-MAP, Biomarker Driven Clinical Trials for Lung Cancer
将放射组学整合到 S0819 和 Lung-MAP、生物标​​志物驱动的肺癌临床试验中
  • 批准号:
    10417115
  • 财政年份:
    2018
  • 资助金额:
    $ 49.79万
  • 项目类别:
III: Small: Integrating and Interpreting Heterogeneous Genomic Data Through Deep Learning
III:小:通过深度学习整合和解释异质基因组数据
  • 批准号:
    1715017
  • 财政年份:
    2017
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Continuing Grant
III: Small: Integrating Casual Discovery and Feature Selection with Streaming Features
III:小:将休闲发现和特征选择与流媒体功能相结合
  • 批准号:
    1652107
  • 财政年份:
    2016
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了