Statistical Inference for Complex Data

复杂数据的统计推断

基本信息

项目摘要

The advent of computers is routinely bringing large, very large datasets for analysis. How to analyze theattendant data and/or how to glean useful information from these data is anything but routine. This proposal investigates two broad areas, viz., mixture decomposition, and regression in the presence of taxonomy and hierarchical variables. The mixture decomposition work is concerned with data in which the observation is a distribution function in the p-dimensional Cartesian product of distributions space, rather than the single point in p-dimensional space of classical data. Such data arise naturally, or after aggregation of original data to a more manageable size yet retaining its inherent information. A goal is to partition these distributions into coherent classes and to estimate the relevant class distributions. It is proposed to adapt ideas from copula theory for classical data, to data comprised of distributions. Embedded in this process is the need to study parameter estimation. Different partitioning techniques will be explored such as dynamical clustering, different measures of fit criterion will be considered, e.g., log-likelihood classification; and different estimation methods explored for the underlying copulas and the associated distributions and their parameters, e.g., maximum likelihood, nonparametric methods such as Parzen's truncated window. The resulting methodology will have wide applicability to those datasets generated in, e.g., meteorology, environmental science, social sciences, health-care programs, and the like. Regression methods when taxonomy variables, and when hierarchical variables, are present will also be developed. This will first be executed for classical data, and then extended to interval-valued data and to histogram- (or frequency-) valued data.With modern computers generating very large datasets, it is imperativethat techniques be developed for analysing such datasets. To date veryfew methods exist. The research will develop new methodologies foranalysing these data. A first step is to aggregate the data in somewell-defined but meaningful way. This aggregation will thence producedata in the form of lists, intervals, or distributions, and these datawill now have some form of internal structure. The research will focuson such data of two types. One will be where the data now consist ofdistributions, and where the goal is to develop methods to identify theappropraite mixture of distributions that describe these data. Anotherdeals with taxonomy and hierarical data, with the goal of establishingregression relationships that will explain the underlying processgoverning the variables involved. The resulting methodologies willallow analysis and interpretation of contemporary datastes wherecurrently no methods exist.
计算机的出现通常会带来大型,非常大的数据集用于分析。 如何分析theattendant数据和/或如何从这些数据中收集有用的信息只是例行信息。该提案调查了两个广泛的领域,即分类法和分层变量的混合物分解和回归。 混合分解工作涉及数据,其中观察是分布空间的p维笛卡尔产物中的分布函数,而不是经典数据的p维空间中的单个点。 这种数据自然出现,或者在将原始数据汇总到更易于管理的大小之后,但保留其固有信息。一个目标是将这些分布分配到连贯的类中,并估算相关的类别分布。 提议将思想从Copula理论中用于经典数据,以及由分布组成的数据。 嵌入在此过程中的是需要研究参数估计。 将探讨不同的分区技术,例如动态聚类,将考虑不同的拟合标准度量,例如对数类样分类;以及针对基础Copulas及其相关分布及其参数的不同估计方法,例如最大似然,非参数方法,例如Parzen的截断窗口。 由此产生的方法将广泛适用于产生的数据集,例如气象,环境科学,社会科学,医疗保健计划等。 当分类变量和层次变量存在时,还将开发回归方法。 这将首先用于经典数据,然后将其扩展到间隔值数据和直方图 - (或频率)有价值的数据。与现代计算机生成非常大数据集的现代计算机,它是为分析此类数据集开发的不完美的技术。迄今为止存在非常富裕的方法。这项研究将开发新的方法,这些方法可以使这些数据产生影响。第一步是以某种定义但有意义的方式汇总数据。此聚合将以列表,间隔或分布的形式产生,这些汇总现在具有某种形式的内部结构。这项研究将重点的两种类型的数据。一个将是现在由分布的数据组成的地方,而目标是开发方法以识别描述这些数据的分布的及苯二颗粒混合物。另一个具有分类学和等级数据的台词,其目的是建立回归关系,以解释涉及的变量的基本处理程序。最终的方法将允许对当代数据的分析和解释,在此期间不存在任何方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

暂无数据

数据更新时间:2024-06-01

Lynne Billard其他文献

Hierarchical clustering for histogram data
直方图数据的层次聚类
span style=font-family:quot;Times New Romanquot;,serif;font-size:12pt;Principal Component Analysis for Compositional Data Vectors/span
成分数据向量的主成分分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    1.3
  • 作者:
    Huiwen Wang;Liying Shangguan;Rong Guan;Lynne Billard
    Huiwen Wang;Liying Shangguan;Rong Guan;Lynne Billard
  • 通讯作者:
    Lynne Billard
    Lynne Billard
Dissimilarity Measures for Histogram-valued Observations
直方图值观测值的相异性测量
On a matrix‐valued autoregressive model
矩阵值自回归模型
共 4 条
  • 1
前往

Lynne Billard的其他基金

Symbolic Inference for Very Large Datasets
非常大的数据集的符号推理
  • 批准号:
    0805245
    0805245
  • 财政年份:
    2008
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Workshop: Pathways to the Future Workshop 2004
研讨会:未来之路研讨会 2004
  • 批准号:
    0400585
    0400585
  • 财政年份:
    2004
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Pathways to the Future Workshop 2003
未来之路研讨会 2003
  • 批准号:
    0307631
    0307631
  • 财政年份:
    2003
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    0102306
    0102306
  • 财政年份:
    2001
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
U.S.-France Cooperative Research (INRIA): Symbolic Data Analysis Project
美法合作研究(INRIA):符号数据分析项目
  • 批准号:
    0093738
    0093738
  • 财政年份:
    2001
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
International Biometric Conference - San Francisco
国际生物识别会议 - 旧金山
  • 批准号:
    0070176
    0070176
  • 财政年份:
    2000
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
International Biometric Conference to be held December 13-18, 1998, in Cape Town, South Africa
国际生物识别会议将于1998年12月13日至18日在南非开普敦举行
  • 批准号:
    9730906
    9730906
  • 财政年份:
    1998
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Mathematical Sciences: Workshop: Statistical Image Analysis - July 1-5, 1996
数学科学:研讨会:统计图像分析 - 1996 年 7 月 1-5 日
  • 批准号:
    9626865
    9626865
  • 财政年份:
    1996
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    9629283
    9629283
  • 财政年份:
    1996
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Mathematical Sciences: International Biometric Conference
数学科学:国际生物识别会议
  • 批准号:
    9628290
    9628290
  • 财政年份:
    1996
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant

相似国自然基金

融合符号推理与深度学习的复杂语境下实体关系抽取技术研究
  • 批准号:
    62376033
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于复杂微行为的电商用户特质推理及多属性需求预测研究
  • 批准号:
    72301143
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
面向复杂场景的知识图谱多跳推理技术研究
  • 批准号:
    62306156
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
复杂知识表示与推理及其在IMO自动答题中的应用
  • 批准号:
    62250057
  • 批准年份:
    2022
  • 资助金额:
    100.00 万元
  • 项目类别:
    专项项目
复杂视觉场景的多任务学习与跨任务推理技术研究
  • 批准号:
    62201484
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Poly-Matching Causal Inference for Assessing Multiple Acute Medical Managements of Pediatric Traumatic Brain Injuries
用于评估小儿创伤性脑损伤的多种急性医疗治疗的多重匹配因果推理
  • 批准号:
    10586785
    10586785
  • 财政年份:
    2023
  • 资助金额:
    --
    --
  • 项目类别:
Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science
揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架
  • 批准号:
    2311064
    2311064
  • 财政年份:
    2023
  • 资助金额:
    --
    --
  • 项目类别:
    Standard Grant
    Standard Grant
Bayesian Modeling and Inference for High-Dimensional Disease Mapping and Boundary Detection"
用于高维疾病绘图和边界检测的贝叶斯建模和推理”
  • 批准号:
    10568797
    10568797
  • 财政年份:
    2023
  • 资助金额:
    --
    --
  • 项目类别:
Novel and Rigorous Statistical Learning and Inference for Comparative Effectiveness Research with Complex Data
复杂数据比较有效性研究的新颖而严格的统计学习和推理
  • 批准号:
    10635323
    10635323
  • 财政年份:
    2023
  • 资助金额:
    --
    --
  • 项目类别:
Objective and noninvasive diagnosis of middle-ear and conductive pathologies using simulation-based inference and transfer learning applied to clinical data
使用基于模拟的推理和应用于临床数据的迁移学习来客观、无创地诊断中耳和传导性病变
  • 批准号:
    10438246
    10438246
  • 财政年份:
    2022
  • 资助金额:
    --
    --
  • 项目类别: