メニーコア超並列クラスタにおける多倍長演算に関する研究
多核大规模并行集群中多精度运算研究
基本信息
- 批准号:22K12045
- 负责人:
- 金额:$ 2.5万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
2022年度はSIMD命令であるArm Scalable Vector Extension(SVE)命令を用いて多倍長整数乗算および数論変換(Number-Theoretic Transform、以下NTT)の高速化を行った。多倍長演算ライブラリとしてGNU Multi-Precision Library(GMP)が知られているが、SIMD命令はほとんど用いられていない。Reduced-radix表現を用いることで、キャリーの伝搬処理の回数を削減するとともに、ベクトル化を行うことができた。Arm SVE命令をサポートしているA64FXプロセッサにおける性能評価の結果、提案手法がGMPに比べて最大36%高速に整数乗算を実行できることを示した。また、NTTのカーネルには剰余乗算が含まれているが、Shoup乗算を用いることで時間の掛かる除算を実質的に行うことなく、乗算、加減算およびシフト演算のみで剰余乗算を行えることが知られている。そこで、Arm SVE命令を用いてNTTのカーネルをベクトル化するとともに、MPIとOpenMPを用いて並列化を行った。性能評価の結果、提案する並列NTTの実装はA64FXプロセッサからなるクラスタであるFujitsu PRIMEHPC FX1000(1024ノード、4096MPIプロセス)において4831 Gopsの性能を示した。さらに、2022年度に行った研究成果を国際会議で発表した。
在 2022 财年,我们使用了 Arm 可扩展向量扩展 (SVE) 指令(SIMD 指令)来加速多精度整数乘法和数论变换 (NTT)。 GNU多精度库(GMP)被称为多精度算术库,但很少使用SIMD指令。通过使用简化基数表示,我们能够减少进位传播过程的数量并执行矢量化。支持 Arm SVE 指令的 A64FX 处理器上的性能评估结果表明,所提出的方法执行整数乘法的速度比 GMP 快 36%。另外,虽然NTT的内核包括模乘法,但是已知通过使用Shoup乘法,可以仅使用乘法、加法、减法和移位运算来执行模乘法,而无需实际执行耗时的除法。因此,我们使用 Arm SVE 指令对 NTT 内核进行矢量化,并使用 MPI 和 OpenMP 对其进行并行化。性能评估结果显示,所提出的并行 NTT 实现在 Fujitsu PRIMEHPC FX1000(1024 个节点,4096 个 MPI 进程)(由 A64FX 处理器组成的集群)上显示出 4831 Gops 的性能。此外,2022年进行的研究成果在国际会议上公布。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Implementation of Parallel Number-Theoretic Transform on Manycore Clusters
众核集群上并行数论变换的实现
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:R. Tamura;J. Lin;Y. Futamura;T. Sakurai;T. Miyazaki;上ノ山功基,廣田悠輔;廣田悠輔;Takuya Edamatsu and Daisuke Takahashi;Daisuke Takahashi
- 通讯作者:Daisuke Takahashi
Efficient Large Integer Multiplication with Arm SVE Instructions
使用 Arm SVE 指令进行高效大整数乘法
- DOI:10.1145/3578178.3578193
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:R. Tamura;J. Lin;Y. Futamura;T. Sakurai;T. Miyazaki;上ノ山功基,廣田悠輔;廣田悠輔;Takuya Edamatsu and Daisuke Takahashi
- 通讯作者:Takuya Edamatsu and Daisuke Takahashi
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
高橋 大介其他文献
アントラキノン-ヒドラジドハイブリッドによる還元糖の選択的光分解とAGEs 生成阻害への応用
使用蒽醌-酰肼杂化物选择性光解还原糖及其在抑制 AGEs 产生中的应用
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
高城美智;高橋 大介;戸嶋一敦 - 通讯作者:
戸嶋一敦
非負値テンソル因子分解を用いたR3 冬の札幌圏大雪における断面交通量分析
基于非负张量分解的札幌地区冬季大雪R3断面交通分析
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
森 雅弘;植原 量行;高橋 大介;小林 憲一;佐藤嘉洋,円山琢也;橋本晟矢,杉浦聡志 - 通讯作者:
橋本晟矢,杉浦聡志
インドールプレニル基転移酵素の動的立体構造基盤の確立と酵素触媒機能の拡張
吲哚异戊二烯基转移酶动态构象基础的建立及酶催化功能的扩展
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
外川翔太;高橋 大介;戸嶋一敦;植村 朋弘;森田洋行 - 通讯作者:
森田洋行
ホウ素媒介アグリコン転移反応を用いた位置及びβ立体選択的アラビノフラノシル化反応
使用硼介导的糖苷配基转移反应进行区域和β-立体选择性阿拉伯呋喃基化反应
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
稲葉 和樹;内藤 優奈;立花 実奈;戸嶋 一敦;高橋 大介 - 通讯作者:
高橋 大介
高橋 大介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('高橋 大介', 18)}}的其他基金
ホウ素媒介アグリコン転移を用いた1,2-cis フラノシドの精密化学合成と応用
硼介导苷元转移精确化学合成1,2-顺式呋喃糖苷及其应用
- 批准号:
23K26659 - 财政年份:2024
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Precise Synthesis of 1,2-cis Furanosides Using Boron-Mediated Aglycon Delivery and Its Application
硼介导的糖苷配基精确合成1,2-顺式呋喃糖苷及其应用
- 批准号:
23H01966 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Research on algorithm of fast Fourier transform in exascale system
百亿亿级系统快速傅里叶变换算法研究
- 批准号:
19K11989 - 财政年份:2019
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
DNA鎖間架橋除去に働くFAN1ヌクレアーゼの損傷塩基対除去機構
FAN1 核酸酶的受损碱基对去除机制可去除 DNA 链间交联
- 批准号:
14J06948 - 财政年份:2014
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
素励起物理と局所密度ゆらぎの観点から見た超流動崩壊機構の解明
从基本激发物理和局域密度涨落角度阐明超流体塌陷机制
- 批准号:
10J10058 - 财政年份:2010
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ガラス基板上での多段階反応を利用する機能集積型ナノケミカルプローブの開発研究
利用玻璃基板上的多步反应研究和开发功能集成的纳米化学探针
- 批准号:
05J08495 - 财政年份:2005
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ヘテロジニアス環境における高速フーリエ変換の並列アルゴリズムに関する研究
异构环境下快速傅里叶变换并行算法研究
- 批准号:
16680001 - 财政年份:2004
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Young Scientists (A)
PCクラスタにおける高速フーリエ変換の並列アルゴリズムに関する研究
PC集群上快速傅里叶变换并行算法研究
- 批准号:
14780185 - 财政年份:2002
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
並列計算機における高速フーリエ変換のアルゴリズムに関する研究
并行计算机上的快速傅里叶变换算法研究
- 批准号:
12780190 - 财政年份:2000
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
並列計算機による高精度数学定数の高速計算法に関する研究
利用并行计算机高速计算高精度数学常数的研究
- 批准号:
10780166 - 财政年份:1998
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Equivariant index theory of infinite-dimensional manifolds and related topics
无限维流形等变指数理论及相关主题
- 批准号:
23K12970 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Hierarchical structure of knowledge networks and hierarchical analogical reasoning
知识网络的层次结构与层次类比推理
- 批准号:
23K18497 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
数値数式融合計算による準素分解の高速化
通过数值公式融合计算加速半初等分解
- 批准号:
22K13901 - 财政年份:2022
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Global analysis of GKZ systems and new development of intersection theory
GKZ系统全局分析及交集理论新进展
- 批准号:
22K13930 - 财政年份:2022
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
代数的言語理論と類体論の融合研究
代数语言理论与类域论的融合研究
- 批准号:
22K03248 - 财政年份:2022
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)