Statistical Inference for Complex Data

复杂数据的统计推断

基本信息

项目摘要

The advent of computers is routinely bringing large, very large datasets for analysis. How to analyze theattendant data and/or how to glean useful information from these data is anything but routine. This proposal investigates two broad areas, viz., mixture decomposition, and regression in the presence of taxonomy and hierarchical variables. The mixture decomposition work is concerned with data in which the observation is a distribution function in the p-dimensional Cartesian product of distributions space, rather than the single point in p-dimensional space of classical data. Such data arise naturally, or after aggregation of original data to a more manageable size yet retaining its inherent information. A goal is to partition these distributions into coherent classes and to estimate the relevant class distributions. It is proposed to adapt ideas from copula theory for classical data, to data comprised of distributions. Embedded in this process is the need to study parameter estimation. Different partitioning techniques will be explored such as dynamical clustering, different measures of fit criterion will be considered, e.g., log-likelihood classification; and different estimation methods explored for the underlying copulas and the associated distributions and their parameters, e.g., maximum likelihood, nonparametric methods such as Parzen's truncated window. The resulting methodology will have wide applicability to those datasets generated in, e.g., meteorology, environmental science, social sciences, health-care programs, and the like. Regression methods when taxonomy variables, and when hierarchical variables, are present will also be developed. This will first be executed for classical data, and then extended to interval-valued data and to histogram- (or frequency-) valued data.With modern computers generating very large datasets, it is imperativethat techniques be developed for analysing such datasets. To date veryfew methods exist. The research will develop new methodologies foranalysing these data. A first step is to aggregate the data in somewell-defined but meaningful way. This aggregation will thence producedata in the form of lists, intervals, or distributions, and these datawill now have some form of internal structure. The research will focuson such data of two types. One will be where the data now consist ofdistributions, and where the goal is to develop methods to identify theappropraite mixture of distributions that describe these data. Anotherdeals with taxonomy and hierarical data, with the goal of establishingregression relationships that will explain the underlying processgoverning the variables involved. The resulting methodologies willallow analysis and interpretation of contemporary datastes wherecurrently no methods exist.
计算机的出现通常会带来大量非常大的数据集进行分析。 如何分析服务员数据和/或如何从这些数据中收集有用信息绝非例行公事。该提案研究了两个广泛的领域,即混合分解和存在分类和层次变量的回归。 混合分解工作涉及的数据是观测值是分布空间的 p 维笛卡尔积中的分布函数,而不是经典数据的 p 维空间中的单点。 此类数据自然产生,或者在将原始数据聚合到更易于管理的大小但保留其固有信息之后产生。目标是将这些分布划分为一致的类别并估计相关的类别分布。 建议将经典数据的联结理论的思想改编为由分布组成的数据。 这个过程中嵌入了研究参数估计的需要。 将探索不同的划分技术,例如动态聚类,将考虑不同的拟合标准度量,例如对数似然分类;以及针对底层联结和相关分布及其参数探索的不同估计方法,例如最大似然、非参数方法(例如 Parzen 截断窗口)。 由此产生的方法将广泛适用于气象学、环境科学、社会科学、医疗保健项目等中生成的数据集。 还将开发存在分类变量和层次变量时的回归方法。 这将首先针对经典数据执行,然后扩展到区间值数据和直方图(或频率)值数据。随着现代计算机生成非常大的数据集,必须开发用于分析此类数据集的技术。迄今为止,存在的方法很少。该研究将开发分析这些数据的新方法。第一步是以某种定义明确但有意义的方式聚合数据。此聚合将产生列表、区间或分布形式的数据,并且这些数据现在将具有某种形式的内部结构。该研究将重点关注两类数据。其中之一是数据现在由分布组成,目标是开发方法来识别描述这些数据的适当分布混合。另一个涉及分类法和层次数据,其目标是建立回归关系,以解释所涉及变量的基本过程。由此产生的方法将允许对目前尚无方法存在的当代数据进行分析和解释。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lynne Billard其他文献

Hierarchical clustering for histogram data
直方图数据的层次聚类
span style=font-family:quot;Times New Romanquot;,serif;font-size:12pt;Principal Component Analysis for Compositional Data Vectors/span
成分数据向量的主成分分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    1.3
  • 作者:
    Huiwen Wang;Liying Shangguan;Rong Guan;Lynne Billard
  • 通讯作者:
    Lynne Billard
Dissimilarity Measures for Histogram-valued Observations
直方图值观测值的相异性测量
On a matrix‐valued autoregressive model
矩阵值自回归模型

Lynne Billard的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lynne Billard', 18)}}的其他基金

Symbolic Inference for Very Large Datasets
非常大的数据集的符号推理
  • 批准号:
    0805245
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshop: Pathways to the Future Workshop 2004
研讨会:未来之路研讨会 2004
  • 批准号:
    0400585
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Pathways to the Future Workshop 2003
未来之路研讨会 2003
  • 批准号:
    0307631
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    0102306
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
U.S.-France Cooperative Research (INRIA): Symbolic Data Analysis Project
美法合作研究(INRIA):符号数据分析项目
  • 批准号:
    0093738
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
International Biometric Conference - San Francisco
国际生物识别会议 - 旧金山
  • 批准号:
    0070176
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
International Biometric Conference to be held December 13-18, 1998, in Cape Town, South Africa
国际生物识别会议将于1998年12月13日至18日在南非开普敦举行
  • 批准号:
    9730906
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Mathematical Sciences: Workshop: Statistical Image Analysis - July 1-5, 1996
数学科学:研讨会:统计图像分析 - 1996 年 7 月 1-5 日
  • 批准号:
    9626865
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    9629283
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Mathematical Sciences: International Biometric Conference
数学科学:国际生物识别会议
  • 批准号:
    9628290
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

面向复杂场景的知识图谱多跳推理技术研究
  • 批准号:
    62306156
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
融合符号推理与深度学习的复杂语境下实体关系抽取技术研究
  • 批准号:
    62376033
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
复杂视觉场景的多任务学习与跨任务推理技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向工业互联网的有色冶金过程复杂要素多源特征融合表征方法与组织推理
  • 批准号:
    92167105
  • 批准年份:
    2021
  • 资助金额:
    80 万元
  • 项目类别:
    地区科学基金项目
面向工业互联网复杂要素的多源特征融合表征与组织推理研究
  • 批准号:
    92167110
  • 批准年份:
    2021
  • 资助金额:
    80 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Poly-Matching Causal Inference for Assessing Multiple Acute Medical Managements of Pediatric Traumatic Brain Injuries
用于评估小儿创伤性脑损伤的多种急性医疗治疗的多重匹配因果推理
  • 批准号:
    10586785
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science
揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架
  • 批准号:
    2311064
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Bayesian Modeling and Inference for High-Dimensional Disease Mapping and Boundary Detection"
用于高维疾病绘图和边界检测的贝叶斯建模和推理”
  • 批准号:
    10568797
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Novel and Rigorous Statistical Learning and Inference for Comparative Effectiveness Research with Complex Data
复杂数据比较有效性研究的新颖而严格的统计学习和推理
  • 批准号:
    10635323
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Objective and noninvasive diagnosis of middle-ear and conductive pathologies using simulation-based inference and transfer learning applied to clinical data
使用基于模拟的推理和应用于临床数据的迁移学习来客观、无创地诊断中耳和传导性病变
  • 批准号:
    10438246
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了