Multiscale Generalized Correlation: A Unified Distance-Based Correlation Measure for Dependency Discovery

多尺度广义相关性:用于依赖性发现的统一的基于距离的相关性测量

基本信息

  • 批准号:
    1712947
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-07-01 至 2019-03-31
  • 项目状态:
    已结题

项目摘要

Detecting relationships between two data sets has long been one of the most important questions in statistics and is fundamental to scientific discovery in the big-data era. By developing an open-source, robust, efficient, and scalable statistical methodology for testing dependence on modern data, this project aims to advance the understanding and utility of testing dependence, tackle a number of related statistical inference questions, and accelerate a broad range of data-intensive research. The project incorporates fundamental research in mathematics, statistics, and computer science to further develop a multiscale generalized correlation framework to enable discovery and decision-making via analysis of large and complex data. The tools under development will allow scientists to better explore and understand high-dimensional, nonlinear, and multi-modal data in a myriad of applications. The project aims to provide a unified framework for discovery of relationships between observations in an efficient and theoretically-sound manner. Combining the notion of generalized correlation with the locality principle, multiscale generalized correlation (MGC) is a superior correlation measure that equals the optimal local correlation among all possible local scales. By building upon distance correlation and making use of nearest neighbors, the resulting MGC test statistic is a unique dependence measure that is consistent for testing against all dependencies with finite second moment, and it exhibits better performance than existing state-of-art methods under a wide variety of nonlinear and high-dimensional dependencies. By investigating the theoretical aspects of distance-based correlations, this project aims to further improve the finite-sample performance of MGC-style tests, extend its capability to testing dependence on network and kernel data, and broaden its utility to general inferential questions beyond dependence testing such as two-sample testing, outlier detection, and feature screening, as well as applications to brain activity, networks, and text analysis. Overall, this project intends to establish a unified methodology framework for statistical testing in high-dimensional, noisy, big data, through theoretical advancements, comprehensive simulations, and real data experiments.
检测两个数据集之间的关系长期以来一直是统计中最重要的问题之一,对于大数据时代的科学发现至关重要。通过开发一种开源,健壮,有效和可扩展的统计方法来测试对现代数据的依赖,该项目旨在提高测试依赖性的理解和实用性,解决许多相关的统计推断问题,并加速一系列数据密集型研究。该项目结合了数学,统计学和计算机科学方面的基本研究,以进一步开发多尺度的广义相关框架,以通过大型和复杂数据的分析来实现发现和决策。所开发的工具将使科学家能够更好地探索和理解无数应用程序中的高维,非线性和多模式数据。该项目旨在提供一个统一的框架,以有效和理论上的方式发现观察之间的关系。将广义相关性的概念与位置原理相结合,多尺度广义相关性(MGC)是一种优越的相关度量,它等于所有可能的局部尺度之间的最佳局部相关性。通过建立距离相关性并利用最近的邻居,由此产生的MGC测试统计量是一种独特的依赖度量,对于对所有有限第二时刻的所有依赖性测试都是一致的,并且比在各种非线性和高维依赖性下的现有最先进方法表现出更好的性能。通过调查基于距离的相关性的理论方面,该项目旨在进一步提高MGC式测试的有限样本性能,将其能力扩展到测试对网络和内核数据的依赖性,并将其效用扩大到一般推论问题,而不是依赖性测试,例如二次样本测试,远程测试,概述筛选,并进行筛选,并进行分析,并进行分析,并进行分析,并进行了细分,以及大脑的应用程序,以及对大脑进行分析。总体而言,该项目打算通过理论进步,全面的模拟和实际数据实验建立一个统一的方法框架,以在高维,嘈杂,大数据中进行统计测试。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Discovering and deciphering relationships across disparate data modalities
  • DOI:
    10.7554/elife.41690
  • 发表时间:
    2019-01-15
  • 期刊:
  • 影响因子:
    7.7
  • 作者:
    Vogelstein, Joshua T.;Bridgeford, Eric W.;Shen, Cencheng
  • 通讯作者:
    Shen, Cencheng
From Distance Correlation to Multiscale Graph Correlation
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Cencheng Shen其他文献

Graph Encoder Ensemble for Simultaneous Vertex Embedding and Community Detection
用于同时顶点嵌入和社区检测的图编码器集成
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cencheng Shen;Youngser Park;C. Priebe
  • 通讯作者:
    C. Priebe
Discovering Relationships Across Disparate Data Modalities
发现不同数据模式之间的关系
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cencheng Shen;C. Priebe;M. Maggioni;J. Vogelstein
  • 通讯作者:
    J. Vogelstein
hyppo: A Comprehensive Multivariate Hypothesis Testing Python Package
hyppo:全面的多元假设检验 Python 包
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sambit Panda;S. Palaniappan;Junhao Xiong;Eric W. Bridgeford;Ronak R. Mehta;Cencheng Shen;J. Vogelstein
  • 通讯作者:
    J. Vogelstein
Efficient Graph Encoder Embedding for Large Sparse Graphs in Python
Python 中大型稀疏图的高效图编码器嵌入
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xihan Qin;Cencheng Shen
  • 通讯作者:
    Cencheng Shen
Learning sources of variability from high-dimensional observational studies
从高维观察研究中学习变异性的来源
  • DOI:
    10.48550/arxiv.2307.13868
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eric W. Bridgeford;Jaewon Chung;B. Gilbert;Sambit Panda;Adam Li;Cencheng Shen;A. Badea;B. Caffo;J. Vogelstein
  • 通讯作者:
    J. Vogelstein

Cencheng Shen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Cencheng Shen', 18)}}的其他基金

Neural Net Learning for Graph Data
图数据的神经网络学习
  • 批准号:
    2113099
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Multiscale Generalized Correlation: A Unified Distance-Based Correlation Measure for Dependency Discovery
多尺度广义相关性:用于依赖性发现的统一的基于距离的相关性测量
  • 批准号:
    1921310
  • 财政年份:
    2018
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

字典设计理论统一下的广义正交线性调频复用信号应用于水声探测通信一体化的波形设计方法研究
  • 批准号:
    52371352
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
广义四元数代数上的若干超矩阵方程组及应用
  • 批准号:
    12371023
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
三轴卸荷下深部复合岩石广义应力松弛特性及时效破损机理研究
  • 批准号:
    52304099
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
自支撑极紫外2D广义叉形光栅的涡旋生成、色散及高阶衍射抑制特性
  • 批准号:
    62375281
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于时变极值分布广义密度全局演化方程的混凝土结构抗震整体可靠度分析
  • 批准号:
    12302037
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Model Development for Prediction of Surgical Outcome in Temporal Lobe Epilepsy Patients: Incorporation of the Correlation between Post-Surgical Reorganization Phenotypes and Pre-Surgical Data
预测颞叶癫痫患者手术结果的模型开发:纳入术后重组表型与术前数据之间的相关性
  • 批准号:
    9803083
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
Model Development for Prediction of Surgical Outcome in Temporal Lobe Epilepsy Patients: Incorporation of the Correlation between Post-Surgical Reorganization Phenotypes and Pre-Surgical Data
预测颞叶癫痫患者手术结果的模型开发:纳入术后重组表型与术前数据之间的相关性
  • 批准号:
    10599186
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
Model Development for Prediction of Surgical Outcome in Temporal Lobe Epilepsy Patients: Incorporation of the Correlation between Post-Surgical Reorganization Phenotypes and Pre-Surgical Data
预测颞叶癫痫患者手术结果的模型开发:纳入术后重组表型与术前数据之间的相关性
  • 批准号:
    10376859
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
Multiscale Generalized Correlation: A Unified Distance-Based Correlation Measure for Dependency Discovery
多尺度广义相关性:用于依赖性发现的统一的基于距离的相关性测量
  • 批准号:
    1921310
  • 财政年份:
    2018
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Generalized Linear Models for Large Correlation Matrices Via Partial Autocorrelations
通过偏自相关的大相关矩阵的广义线性模型
  • 批准号:
    0906252
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了