疑似多倍長演算による現代アーキテクチャに適した高速な数値計算アルゴリズムの創生
使用伪多精度运算创建适合现代架构的高速数值计算算法
基本信息
- 批准号:22KJ2741
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
近接・重複固有値が存在しない場合の固有値分解及び近接・重複特異値が存在しない場合の特異値分解に対する高精度数値計算アルゴリズムの開発に従事し,以下の研究を実施した.(1) 先行研究では,ある数値計算法によって得られた近似固有ベクトルの精度を改善する反復改良法が提案されている.この手法は主に高精度行列積で構成されており,またすべての演算は高精度に計算する必要があるとされていた.本研究では一部の計算を低精度に計算しても同様の収束性をもつことを示し,1反復当たりの高精度行列積の回数を削減できた.コンシューマ向けGPUやスーパーコンピュータ「富岳」などの様々な環境での数値実験により,提案手法の高速性を明らかにした.(2) (1)で開発した手法を基に,1反復当たりの高精度行列積をさらに削減した混合精度反復改良法を提案した.本アルゴリズムは先行研究と同程度の収束性をもちながら1反復当たりの計算時間が削減される.(3) (1)と同様に,先行研究によって提案されている特異値分解に対する反復改良法を混合精度数値計算アルゴリズムへ拡張し,1反復当たりの高精度行列積の回数を削減した.(4) (3)で開発した手法を基に,1反復当たりの高精度行列積をさらに削減した混合精度反復改良法を提案した.本アルゴリズムは先行研究と同程度の収束性をもちながら1反復当たりの計算時間が削減される.(2)と同様に,数値実験によって提案手法の高速性を明らかにした.また,エラーフリー変換を用いた高速な高精度行列乗算アルゴリズムについて,グラム行列を生成する行列積に対する効率的なアプローチを提案した.さらに,様々な精度保証法で必要な3つの行列の積の包含について,従来法よりもタイトな結果を同等の計算コストで得る手法を提案し,それに対する誤差解析も行った.以上の成果について,学会発表や論文投稿も実施した.
本人从事不存在相邻或重叠特征值时的特征值分解,以及不存在相邻或重叠奇异值时的奇异值分解的高精度数值计算算法的开发,并进行了以下研究。 (1) 以往的研究提出了迭代改进方法来提高某些数值计算方法得到的近似特征向量的精度。该方法主要是高精度矩阵乘法,所有运算都必须高精度计算。在这项研究中,我们表明,即使以较低精度执行某些计算,也能实现类似的收敛,并且我们能够减少每次迭代的高精度矩阵乘法次数。在消费级 GPU 和超级计算机“Fugaku”等各种环境中的数值实验揭示了该方法的高速性。 (2)基于(1)中提出的方法,我们提出了一种混合精度迭代改进方法,进一步减少了每次迭代的高精度矩阵乘积的数量。该算法具有与之前研究相当的收敛性,同时减少了每次迭代的计算时间。 (3)与(1)类似,我们将先前研究中提出的奇异值分解的迭代改进方法扩展到混合精度数值算法,以减少每次迭代的高精度矩阵乘积的数量。 (4)基于(3)中提出的方法,我们提出了一种混合精度迭代改进方法,进一步减少了每次迭代的高精度矩阵乘积的数量。该算法具有与之前研究相当的收敛性,同时减少了每次迭代的计算时间。与(2)类似,我们通过数值实验证明了该方法的高速性。我们还提出了一种有效的矩阵乘法方法,可以使用无差错变换生成 Gram 矩阵,以实现快速、高精度的矩阵乘法算法。此外,针对各种精度保证方法中所需的三个矩阵的乘积的包含,我们提出了一种在相同计算成本下获得比传统方法更严格结果的方法,并对该方法进行了误差分析。我们还在学术会议上展示了结果并提交了论文。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
特異値分解に対する反復改良法の大規模並列環境における実装と評価
大规模并行环境下奇异值分解迭代改进方法的实现与评估
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:内野 佑基; 尾崎 克久
- 通讯作者:尾崎 克久
Performance Evaluation of Iterative Refinement for Singular Value Decomposition on a Supercomputer
超级计算机上奇异值分解迭代细化的性能评估
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Yuki Uchino; Katsuhisa Ozaki
- 通讯作者:Katsuhisa Ozaki
BLASX: A High Performance Level-3 BLAS Library for Heterogeneous Multi-GPU Computing
BLASX:用于异构多 GPU 计算的高性能 3 级 BLAS 库
- DOI:10.1145/2925426.2926256
- 发表时间:2015-10-16
- 期刊:
- 影响因子:0
- 作者:Linnan Wang;Wei Wu;Jianxiong Xiao;Yezhou Yang
- 通讯作者:Yezhou Yang
Inclusion Methods for Multiplication of Three Point Matrices
三点矩阵乘法的包含方法
- DOI:10.15748/jasse.10.83
- 发表时间:2023
- 期刊:
- 影响因子:0.5
- 作者:Yuki Uchino; Katsuhisa Ozaki; Takeshi Terao
- 通讯作者:Takeshi Terao
固有値・特異値分解の混合精度数値計算法の性能評価
特征值/奇异值分解混合精度数值计算方法的性能评估
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:内野 佑基; 寺尾 剛史; 尾崎 克久
- 通讯作者:尾崎 克久
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
内野 佑基其他文献
内野 佑基的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Improvement of Convergence and Performance for the Krylov Subspace Methods using High-Precision Arithmetic
使用高精度算法改进 Krylov 子空间方法的收敛性和性能
- 批准号:
25330141 - 财政年份:2013
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
偏微分方程式の解に対する精度保証付き数値計算法の発展
开发保证偏微分方程解精度的数值计算方法
- 批准号:
11J07191 - 财政年份:2011
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for JSPS Fellows