大標本・高次元で一致性を持つ情報量規準を用いた多変量回帰モデルの変数選択

使用大样本、高维和一致信息标准的多元回归模型的变量选择

基本信息

  • 批准号:
    21J21210
  • 负责人:
  • 金额:
    $ 0.7万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-28 至 2022-03-31
  • 项目状态:
    已结题

项目摘要

情報量規準によるモデル選択は、一致性と呼ばれる性質を持つことが期待される。一致性とは、そのモデル選択手法が、漸近的に確率1で正しいモデルを選択する性質である。ある情報量規準が一致性を持つか否かは扱う漸近理論によって異なる。多変量正規線形回帰モデルに対しては、赤池情報量規準は高次元漸近理論で一致性を持つ一方で、ベイズ情報量規準は大標本漸近理論で一致性を持つことが知られている。ただ、現実には手元にあるデータが有限である以上、どの漸近理論がデータにふさわしいかを判断することはできない。従って、情報量規準によるモデル選択の結果、真のモデルとはかけ離れたモデルが選択されると、データの説明や予測に重大な悪影響を及ぼしうる。Kono and Kubokawa (2021) は、この問題を理論的に自然な方法で解決した。具体的には、事前分布にspike and slab分布と呼ばれる特殊な分布を仮定したベイズモデルを考え、その予測周辺尤度の推定量として情報量規準を構成した。また、それが多変量線形回帰モデルにおいて、大標本・高次元双方の漸近理論で一致性を持つことを証明した。数値計算の結果も良好で、これまでに提案されてきた情報量規準を上回るパフォーマンスを発揮した。また、従来の多くの研究は、データが独立同一分布に従う場合のみを扱っており、そうでないデータへの適用はあまり明らかではない。そこで、Kono and Kubokawa (2021) で導出した情報量規準が、相関構造を持つデータに対して有効かどうかを検証した。その結果、シンプルな時系列構造や空間構造を持つデータに対しても、わずかな修正をするだけで、提案した情報量規準が適用可能であることが分かった。提案手法の頑健性を示唆するこの結果は、データの独立性が保証できない場合への応用あたって有用である。
基于信息标准的模型选择预计具有称为一致性的属性。一致性是模型选择方法以概率 1 渐近选择正确模型的属性。某个信息准则是否具有一致性取决于所处理的渐近理论。对于多元正态线性回归模型,已知Akaike信息准则符合高维渐近理论,而Bayesian信息准则符合大样本渐近理论。然而,实际上,由于手头的数据是有限的,因此无法判断哪种渐近理论适合该数据。因此,如果基于信息准则的模型选择结果选择了与真实模型相差甚远的模型,就会对数据解释和预测产生显着的负面影响。 Kono 和 Kubokawa(2021)以理论上自然的方式解决了这个问题。具体来说,我们考虑了一个贝叶斯模型,该模型假设先验分布中存在一种称为尖峰和平板分布的特殊分布,并构建了一个信息标准作为预测边际似然的估计量。我们还证明了它与多元线性回归模型中的大样本和高维渐近理论是一致的。数值计算的结果也很好,表明性能超出了迄今为止提出的信息标准。此外,许多常规研究仅处理数据遵循独立且相同分布的情况,对于不遵循独立且相同分布的数据的应用并不十分明确。因此,我们验证了Kono和Kubokawa(2021)推导的信息准则对于具有相关结构的数据是否有效。结果,我们发现所提出的信息准则只需稍作修改即可应用于具有简单时间序列和空间结构的数据。这一结果表明所提出方法的稳健性,对于无法保证数据独立性的应用非常有用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河野 遥希其他文献

河野 遥希的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Development of novel statistical modeling based on functional data analysis for high-dimensional data and its application
基于函数数据分析的高维数据统计模型开发及其应用
  • 批准号:
    20K11707
  • 财政年份:
    2020
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
説明変数・目的変数が高次元でも変数増減法の下で一致性をもつ変数選択規準の開発
制定变量选择标准,即使解释变量和目标变量具有高维度,也能在变量增减法下保持一致性
  • 批准号:
    20K14363
  • 财政年份:
    2020
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
高次元多変量データにおけるモデル選択規準の一致性
高维多元数据中模型选择标准的一致性
  • 批准号:
    18J12123
  • 财政年份:
    2018
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Theoretical developments of sparse modeling and multivariate analysis techniques
稀疏建模和多元分析技术的理论发展
  • 批准号:
    16K00057
  • 财政年份:
    2016
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Statistical Analysis of High-Dimensional Data
高维数据统计分析
  • 批准号:
    16H03606
  • 财政年份:
    2016
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了