Developments of statistical compression technology for massive data having tensor structures

张量结构海量数据统计压缩技术进展

基本信息

  • 批准号:
    22K19769
  • 负责人:
  • 金额:
    $ 4.08万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-06-30 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究は、コンピューターの性能に依存した従来の学術の体系と方向を大きく変革・転換させ、巨大テンソル型データを低コストで高速かつ高精度に解析できる統計的圧縮技術を開発する。次の3つの研究目的を遂行した。(1) 巨大データ行列の非スパース性と巨大ノイズの推定論の構築(2) 3階テンソル型データの次元の呪いの解明と解決法の提案(3) 巨大テンソル型データの高速・高精度な統計的圧縮技術の開発(1)について、幾つかのクラスが混在する巨大データ行列において、クラス間の潜在構造の差異を非スパース性で捉え、さらにデータの巨大ノイズの漸近的挙動を確率変動で捉えることで、各クラスがもつ階層構造を高精度に抽出する方法を提案した。(2)について、多重線形主成分分析法を用いて、3階テンソル型データにおける潜在構造推定に一致性が成立するための条件を導出した。この条件から、3階テンソル型データにおいて次元の呪いの主原因となる行列型の巨大ノイズが特定された。(3)について、データの潜在情報の抽出と変数選択を同時に処理できる新たな高次元主成分分析法を考案した。これを巨大テンソル型データに前処理として施すことによって、データサイズの大幅な圧縮が可能となる。本研究の成果について、青嶋は日本数学会に招待され秋季総合分科会で企画特別講演を行った。また、矢田・石井とともに幾つかの国際会議で招待講演を行った。本研究課題に関連するシンポジウムを、対面+オンライン(Zoom)のハイブリッド形式により、つくば国際会議場で開催した。なお、本研究課題に関連して、矢田は筑波大学Best Faculty Member Awardを受賞し、石井は日本統計学会小川研究奨励賞を受賞した。
这项研究将显着改变和改变依赖计算机性能的传统学术体系和方向,发展出一种能够低成本、高速、高精度分析大型张量型数据的统计压缩技术。开展了以下三个研究目标。 (1)海量数据矩阵非稀疏性和海量噪声估计理论的建立(2)三阶张量型数据维数诅咒的阐明及解决方案的提出(3)关于大型张量型数据的高速高精度统计压缩技术的发展(1),在多个类混合的大型数据矩阵中,可以非稀疏地捕获类之间潜在结构的差异,我们提出了一种通过使用随机波动捕获巨大噪声的渐近行为来高精度提取每个类的层次结构的方法。关于(2),我们使用多线性主成分分析来推导三阶张量类型数据中潜在结构估计的一致性条件。基于此条件,识别出矩阵型巨大噪声,这是三阶张量型数据维数灾难的主要原因。关于(3),我们设计了一种新的高维主成分分析方法,可以同时从数据中提取潜在信息并选择变量。通过将其应用于大张量型数据作为预处理,可以显着压缩数据大小。关于这项研究成果,青岛应邀在日本数学会秋季总分委员会进行了计划中的特别演讲。他还与雅达和石井一起在多个国际会议上做特邀报告。与该研究主题相关的研讨会在筑波国际会议中心以面对面和在线(Zoom)的混合形式举行。在该研究项目中,矢田获得了筑波大学最佳教员奖,石井获得了日本统计学会小川研究鼓励奖。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
青嶋研究室ホームページ
青岛研究所主页
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hierarchical clustering and its asymptotic behaviors in high-dimensional settings
高维环境中的层次聚类及其渐近行为
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    江頭健斗; 矢田和善;青嶋誠
  • 通讯作者:
    青嶋誠
高次元現象の統計数理
高维现象的统计数学
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    青嶋誠
  • 通讯作者:
    青嶋誠
Geometric classifiers for high-dimensional noisy data
高维噪声数据的几何分类器
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kazuyoshi Yata; Aki Ishii; Makoto Aoshima
  • 通讯作者:
    Makoto Aoshima
Statistical hypothesis testing for high-dimension, low-sample-size data
高维、低样本量数据的统计假设检验
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aoshima Makoto;Ishii Aki;Yata Kazuyoshi
  • 通讯作者:
    Yata Kazuyoshi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

青嶋 誠其他文献

高次元固有ベクトルの検定について
关于测试高维特征向量
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石井 晶;矢田和善;青嶋 誠
  • 通讯作者:
    青嶋 誠
高次元データにおける異常値の検出について
关于检测高维数据中的异常值
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山優吾;矢田和善;青嶋 誠
  • 通讯作者:
    青嶋 誠
高次元におけるカーネル主成分分析の漸近的性質と異常値の検出への応用
高维核主成分分析的渐近性质及其在异常值检测中的应用
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山優吾;矢田和善;青嶋 誠
  • 通讯作者:
    青嶋 誠
高次元データにおける異常値の検出について
关于检测高维数据中的异常值
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中山優吾;矢田和善;青嶋 誠
  • 通讯作者:
    青嶋 誠
高次元二標本問題における最適性について
高维二样本问题的最优性
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    矢田和善;青嶋 誠
  • 通讯作者:
    青嶋 誠

青嶋 誠的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('青嶋 誠', 18)}}的其他基金

Innovative Developments of Theories and Methodologies for Large Complex Data
复杂大数据理论与方法的创新发展
  • 批准号:
    20H00576
  • 财政年份:
    2020
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
二段階抽出法の漸近有効性と多群判別問題への応用および非正規分布への拡張について
关于两阶段抽样方法的渐近有效性、其在多组判别问题中的应用及其对非正态分布的推广
  • 批准号:
    07780202
  • 财政年份:
    1995
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
二段階抽出法の漸近有効性と多群判別問題への応用および非正規分布への拡張について
关于两阶段抽样方法的渐近有效性、其在多组判别问题中的应用及其对非正态分布的推广
  • 批准号:
    07780202
  • 财政年份:
    1995
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
二段階抽出法の漸近的性質と多群判別問題への応用およびその頑健性について
关于两阶段抽样方法的渐近性质、其在多组判别问题中的应用及其鲁棒性
  • 批准号:
    06780218
  • 财政年份:
    1994
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
多変量二段階抽出法における多重比較と多群判別問題への応用およびその頑健性について
多重比较和多组判别问题在多元两阶段抽样方法中的应用及其鲁棒性
  • 批准号:
    05780210
  • 财政年份:
    1993
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似国自然基金

基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Topology-based tumor analysis for medical images
基于拓扑的医学图像肿瘤分析
  • 批准号:
    10653350
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Integrative deep learning algorithms for understanding protein sequence-structure-function relationships: representation, prediction, and discovery
用于理解蛋白质序列-结构-功能关系的集成深度学习算法:表示、预测和发现
  • 批准号:
    10712082
  • 财政年份:
    2023
  • 资助金额:
    $ 4.08万
  • 项目类别:
Machine and deep learning for finding multimodal imaging biomarkers in prodromal AD
机器和深度学习寻找前驱 AD 的多模态成像生物标志物
  • 批准号:
    10181265
  • 财政年份:
    2021
  • 资助金额:
    $ 4.08万
  • 项目类别:
Epidemiology of Biomarkers of AMD Progression
AMD 进展生物标志物的流行病学
  • 批准号:
    10489288
  • 财政年份:
    2021
  • 资助金额:
    $ 4.08万
  • 项目类别:
Innovative Developments of Theories and Methodologies for Large Complex Data
复杂大数据理论与方法的创新发展
  • 批准号:
    20H00576
  • 财政年份:
    2020
  • 资助金额:
    $ 4.08万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了