プログラマビリティと電力効率を両立するSIMDベース・アクセラレータの研究

基于 SIMD 的加速器研究,实现可编程性和功效

基本信息

  • 批准号:
    20H04153
  • 负责人:
  • 金额:
    $ 11.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

2021 年度は以下の2点に関わる研究を行った:1. 命令セットに関する要素技術の研究:これまで Dualflow アーキテクチャは汎用 CPU をターゲットとして研究が行われてきたため,それとは大きく性質が異なる SIMD ベースの GPU では命令セットの性質(主に命令間の参照距離の性質や,これに基づくバイナリ生成時の効率)が大きく異なる.このため,前年度に引き続き今年度も GPU 向けに Dualflow アーキテクチャを導入するための検討と評価を行った.今年度までの研究により,NVIDIA の GPU が持つ命令セットを拡張して Dualflow アーキテクチャによる距離表限を組み込んだ新たな命令セットの基本的な策定が終わり,ベンチマークプログラムをシミュレータ上で評価し検証を行った.2. マイクロアーキテクチャに関する要素技術の研究GPU への Dualflow アーキテクチャの導入にあたって,それを具体的に実現するためのマイクロアーキテクチャを研究した.これまでに GPU シミュレータへの Dualflow 命令の実装を継続して行ってきており,今年度はこのシミュレータを用いてより詳細な検討や評価を行った.これらの実装や評価の過程で,GPU が元から持つスケジューラを活用することで,従来想定していたよりもより少ない変更で GPU に提案手法を実装する方法を発案した.上記の命令セットやマイクロアーキテクチャに関する要素技術の研究の結果,一部ベンチマークでは大きな性能向上を確かめたものの,Dualflow アーキテクチャによる命令数増加により返って性能が低下してしまう場合があり,この点が次年度以降で解決すべき課題となった.
2021财年,我们进行了以下两点相关的研究: 1.指令集相关基础技术的研究:目前为止,Dualflow架构的研究都是针对通用CPU的,因此我们重点研究基于SIMD的架构,该架构具有以下特点: GPU之间的指令集特性(主要是指令之间的参考距离以及基于此的二进制生成效率的特性)差异很大。因此,继去年之后,今年我们也一直在考虑和评估GPU的Dualflow架构的引入。通过截至今年的研究,我们已经完成了新指令集的基本制定,该指令集扩展了 NVIDIA GPU 的指令集,并使用 Dualflow 架构合并了距离表限制,并在模拟器上对基准程序进行了评估和验证。 2.微架构相关基础技术研究在将Dualflow架构引入GPU时,我们研究了微架构来具体实现。到目前为止,我们一直在GPU模拟器中实现Dualflow指令,今年我们利用这个模拟器进行了更详细的研究和评估。在实现和评估过程中,我们设计了一种方法,通过利用 GPU 固有的调度器,在 GPU 上实现所提出的方法,其变化比之前预期的要少。通过对上述指令集和微架构相关基础技术的研究,我们确认在一些基准测试中性能有很大提升,但由于 Dualflow 架构带来的指令数量增加可能会导致性能下降。成为财政年度后应解决的问题。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
D-JOLT: Distant Jolt Prefetcher
D-JOLT:远程震动预取器
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoki Nakamura;Toru Koizumi;Yuya Degawa;Hidetsugu Irie;Shuichi Sakai;and Ryota Shioya
  • 通讯作者:
    and Ryota Shioya
Accurate and Fast Performance Modeling of Processors with Decoupled Front-end
具有解耦前端的处理器的准确快速的性能建模
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuya Degawa;Toru Koizumi;Tomoki Nakamura;Ryota Shioya;Junichiro Kadomoto;Hidetsugu Irie;Shuichi Sakai
  • 通讯作者:
    Shuichi Sakai
STRAIGHTアーキテクチャにおけるスケーラブルなスケジューラの提案と評価
STRAIGHT架构中可扩展调度器的建议和评估
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新 浩太朗;小泉 透;杉田 脩;光野 聡志;門本 淳一郎;塩谷 亮太;入江 英嗣;坂井 修一
  • 通讯作者:
    坂井 修一
Compiling and Optimizing Real-world Programs for STRAIGHT ISA
为 STRAIGHT ISA 编译和优化实际程序
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Toru Koizumi;Shu Sugita;Ryota Shioya;Junichiro Kadomoto;Hidetsugu Irie;Shuichi Sakai
  • 通讯作者:
    Shuichi Sakai
アドレスとタイミングの予測を分離したデータプリフェッチャ
将地址和时序预测分开的数据预取器
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小泉 透;中村 朋生;出川 祐也;入江 英嗣;坂井 修一;塩谷 亮太
  • 通讯作者:
    塩谷 亮太
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塩谷 亮太其他文献

キャッシュ・パーティショニングによる性能向上のためのMLPを意識した実行サイクル数の推定
考虑 MLP 估计执行周期数,以通过缓存分区提高性能
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今泉 勇斗;塩谷 亮太;安藤 秀樹
  • 通讯作者:
    安藤 秀樹
競合予測によるソフトウェアトランザクショナルメモリのオーバヘッド抑制手法
使用冲突预测的软件事务内存开销抑制方法
ブルーム・フィルタを用いたメモリ・アクセス順序違反検出
使用布隆过滤器检测内存访问顺序违规
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    倉田 成己;塩谷 亮太;五島 正裕;坂井 修一
  • 通讯作者:
    坂井 修一
メモリ・アクセス順序違反検出手法の評価
内存访问顺序违规检测方法的评估
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西川 卓;塩谷 亮太;入江 英嗣;五島 正裕;坂井 修一
  • 通讯作者:
    坂井 修一
タイミング・フォールト耐性を持つ Out-of-Order プロセッサ
具有定时容错功能的乱序处理器

塩谷 亮太的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('塩谷 亮太', 18)}}的其他基金

プログラマビリティと最大性能を両立するベクトルアーキテクチャの研究
兼顾可编程性和最大性能的矢量架构研究
  • 批准号:
    09J09259
  • 财政年份:
    2009
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似国自然基金

GPU加速MRI引导的质子实时自适应蒙卡鲁棒放疗计划的研究
  • 批准号:
    12305393
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
超大规模集成GPU系统的可靠性分析及优化研究
  • 批准号:
    62372207
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
能量一阶导数的GPU算法和异构并行计算:WESP软件的发展和向国产异构平台的移植
  • 批准号:
    22373112
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
通用高性能粒子径迹重建软件开发及基于GPU加速的径迹重建研究
  • 批准号:
    12375194
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于动态电压频率调整的GPU集群在线能效优化研究
  • 批准号:
    62302126
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CRII: OAC: A Compressor-Assisted Collective Communication Framework for GPU-Based Large-Scale Deep Learning
CRII:OAC:基于 GPU 的大规模深度学习的压缩器辅助集体通信框架
  • 批准号:
    2348465
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
GPUスーパーコンピュータを用いた1m解像度リアルタイム風況デジタルツイン
使用GPU超级计算机的1m分辨率实时风况数字孪生
  • 批准号:
    23K24855
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
OAC Core: OAC Core Projects: GPU Geometric Data Processing
OAC 核心:OAC 核心项目:GPU 几何数据处理
  • 批准号:
    2403239
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
GPUスパコンを用いた都市風況LESに対するアンサンブルデータ同化の高速化技術の開発
GPU超级计算机城市风况LES高速集合数据同化技术开发
  • 批准号:
    24K20785
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
量子コンピューティング向け超並列GPUシミュレーション
用于量子计算的大规模并行 GPU 模拟
  • 批准号:
    24K14824
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了