Model Selection for Ultra-high Dimensional and Non-linear Data

超高维和非线性数据的模型选择

基本信息

  • 批准号:
    21K17715
  • 负责人:
  • 金额:
    $ 3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

変数の数が標本サイズよりも非常に大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択について, 一般化線形モデルのもとで考察した. 具体的には, 一般化線形モデルにおける周辺尤度最大化基準にスパース性を誘導する正則化項を付加することで, シンプルながらも理論的に良い性質を持つ変数選択基準を提案した. 本研究で提案した手法はスクリーニングと呼ばれる変数選択の一種である. アルゴリズムそのものは線形回帰モデルで提案されたものとほぼ同じものであるが, 本研究ではその基準を, ロジスティック回帰モデルやポアソン回帰モデルのような, 一般化線形モデルに対しても同じように適用可能であることを示した. また, スクリーニングでは, 適当なしきい値を定め, 変数選択のスコアがそのしきい値よりも大きければ変数間に関連があると判断する. 本研究では, 上記のような手法の提案とともに, スコアの漸近分布に基づくしきい値の選択についても提案した. 一方, 昨年に引き続き, カーネル法に基づくスクリーニング手法についても現在論文化を目指している.
对于变量数量远大于样本量的极高维数据分析,我们考虑变量选择,以基于广义线性模型有效地选择与目标变量相关的解释变量。具体来说,我们提出了一种变量选择标准:简单但具有良好的理论特性,通过在广义线性模型中添加导致稀疏性的边际似然最大化准则的正则化项,所提出的方法是一种称为筛选的变量选择。该算法本身与针对线性回归模型提出的算法几乎相同,但在本研究中,该标准可以以相同的方式应用于逻辑回归模型和泊松回归模型等广义线性模型。此外,在筛选时,可以采用适当的方法。设定阈值,如果变量选择分数大于阈值,则确定变量之间存在关系,并提出方法。我们还提出了基于分数渐近分布的阈值选择。另一方面,从去年开始,我们目前的目标是发表一篇关于基于核方法的筛选方法的论文。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
データサイエンスの歩き方
如何走入数据科学之路
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    滋賀大学データサイエンス学部;長崎大学情報データ科学部
  • 通讯作者:
    長崎大学情報データ科学部
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

梅津 佑太其他文献

スパース回帰分析とパターン認識
稀疏回归分析和模式识别
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    梅津 佑太;西井 龍映;上田 勇祐
  • 通讯作者:
    上田 勇祐
大規模計算時代の統計推論
大规模计算时代的统计推断
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bradley Efron;Trevor Hastie;藤澤 洋徳;井手 剛;井尻 善久;井手 剛;牛久 祥孝;梅津 佑太;大塚 琢馬;尾林 慶一;川野 秀一;田栗 正隆;竹内 孝;橋本 敦史;藤澤 洋徳;矢野 恵佑
  • 通讯作者:
    矢野 恵佑

梅津 佑太的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Devolopment and refinement of methods for data analysis by GLM
GLM 数据分析方法的开发和完善
  • 批准号:
    22K06404
  • 财政年份:
    2022
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
長期縦断研究による高齢者の口腔機能低下の要因の検討
通过长期纵向研究探讨老年人口腔功能衰退的原因
  • 批准号:
    21K17038
  • 财政年份:
    2021
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
変量効果分布の誤特定に対して頑健な一般化準線形混合効果モデルの開発
开发广义准线性混合效应模型,该模型对随机效应分布的错误指定具有鲁棒性
  • 批准号:
    20K19759
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
難民の移住国決定要因について:欧州への難民認定申請者は偽装した経済移民なのか
论难民移民国家的决定因素:欧洲寻求庇护者是否是变相的经济移民?
  • 批准号:
    20K01698
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on statistical inference for ultra-high dimensional semiparametric models
超高维半参数模型统计推断研究
  • 批准号:
    20K11705
  • 财政年份:
    2020
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了