1億並列・エクサスケールスーパーコンピュータの耐故障性基盤

适用于 1 亿台并行百亿亿级超级计算机的容错基础设施

基本信息

  • 批准号:
    23240006
  • 负责人:
  • 金额:
    $ 8.32万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 无数据
  • 项目状态:
    已结题

项目摘要

科学技術分野において、大規模なシミュレーションではスーパーコンピュータ(スパコン)の利用が不可欠となっている。しかし、スパコンに搭載される機器の増大・複雑化により、障害発生率が増加し、システムが実質的に動作しなくなると危惧されており、チェックポイント/リスタートなどの耐障害手法の適用が不可避となっているが、ポストペタースケールスパコンでは、技術的な課題が残る。このため、初年度は、1億スレッド・ポストペタのための基礎的な複合的なチェックポイント・リスタートを行うための耐故障性の数理モデル・性能モデルを探求し、特にポストペタスケールアプリケーションに適した耐障害手法の億単位のスレッド時の定量的性質を明らかにすることを目的として研究に従事した。実際、ポストペタ・エクサスケールスパコンの最有力アーキテクチャである細粒度長並列プロセッサ+粗粒度プロセッサを併用するハイブリッド型アーキテクチャにおいて、チェックポイント/リスタートは種々の技術的困難を伴う技術であったが、我々は、単一GPUにおける「リプレイ手法(メモリ割り当てやメモリーコピーの履歴を取り、リスタートの際に、その履歴に基づいて再現実行"リプレイ"を行うことにより、整合性の取れたチェックポイントを取る手法)」を拡張し、ノード内およびノード外の複数のCPU・GPUを使用するアプリケーションにおいて、安定かつ一貫性のとれたチェックポインティングを実現した。また、性能面においても、許容されるレベルのオーバーヘッドまでに押さえた。また、我々が開発したライブラリでは既存のプログラムに変更を加えることなく、これを実現することが可能であり、可用性にも優れている。超細粒度並列・ハイブリッド型アーキテクチャにおける透過的なチェックポイントの実現は、学術的インパクトも大きいと期待される。
在科学技术领域,超级计算机的使用已成为大规模模拟的必备条件。然而,随着超级计算机中安装的设备越来越多、越来越复杂,人们担心故障率会增加,系统基本上会停止工作,因此有必要应用检查点/重启等容错方法,但技术挑战仍然存在。用于后彼得规模的超级计算机。为此,第一年我们将探索亿级线程和后千万级应用程序的基本复杂检查点重启的容错数学模型和性能模型,并开发特别适合我所在的后千万级应用程序的模型。从事旨在阐明处理数亿线程时容错方法的定量特性的研究。事实上,在细粒度长并行处理器和粗粒度处理器相结合的混合架构中,这是后千万亿次超级计算机最流行的架构,检查点/重启是一项涉及各种技术难点的技术“重放技术”(Replay)。单个 GPU 上的内存分配和内存分配”此方法已扩展为通过记录服务器副本的历史记录并在重新启动时根据该历史记录来重播它,从而在使用多个 CPU 和 GPU 的应用程序中实现稳定且一致的检查点。在性能方面,我们还将开销保持在可接受的水平。此外,我们开发的库无需对现有程序进行任何更改即可实现这一目标,并且具有出色的可用性。在超细粒度并行混合架构中实现透明检查点预计将产生巨大的学术影响。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
TSUBAME2.0…Environmentally Friendly Petascale Computing and its Possible Contributions to High-Resolution Natural Disaster Simulations
TSUBAME2.0…环境友好的千万亿次计算及其对高分辨率自然灾害模拟的可能贡献
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashina Y.;Ishida A.;Kakegawa T;Satoshi Matsuoka
  • 通讯作者:
    Satoshi Matsuoka
CPU/GPUヘテロジニアス環境におけるFMMの最適化
CPU/GPU异构环境下FMM优化
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    福田圭祐;丸山直也;松岡聡
  • 通讯作者:
    松岡聡
From Utility Computing to Computing for Utilities : Using Cloud Computing to Accelerate Energy Informatics
从公用事业计算到公用事业计算:利用云计算加速能源信息学
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    黒須玲;関華奈子;原拓也;C. Fowler;S. Curry;J. P. McFadden;G. Hanley;Francois Le Gall;Satoshi Matsuoka
  • 通讯作者:
    Satoshi Matsuoka
Dealing with Grid-Computing Authorization using Identity-Based Certificateless Proxy Signature
使用基于身份的无证书代理签名处理网格计算授权
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N. A. B. Adnan;K. Hoshi;S. Yamashita;Mohamed Amin
  • 通讯作者:
    Mohamed Amin
ワークフローアプリケーションに対する計算資源割り当ての最適化
工作流应用程序的计算资源分配优化
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松岡 聡其他文献

シアノバチルスにおけるシアノバクテリア遺伝子大規模発現の試み
蓝藻基因在蓝藻中大规模表达的尝试
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松岡 聡;篠原 嵩人;朝井 計;戸澤 譲;朝井 計,林田莉奈,白川文教;美田知也,細村匡太郎,渡辺 智,兼崎 友,板谷光泰, 朝井 計, 吉川博文
  • 通讯作者:
    美田知也,細村匡太郎,渡辺 智,兼崎 友,板谷光泰, 朝井 計, 吉川博文
枯草菌RNA ポリメラーゼα サブユニット遺伝子rpoAの発現制御機構の解析
枯草芽孢杆菌RNA聚合酶α亚基基因rpoA表达调控机制分析
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松岡 聡;篠原 嵩人;朝井 計;戸澤 譲;朝井 計,林田莉奈,白川文教
  • 通讯作者:
    朝井 計,林田莉奈,白川文教
Several Methods of Hydrogen Production from Water Using Photocatalytic Materials.
使用光催化材料从水中制氢的几种方法。
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金 光浩;遠藤 敏夫;松岡 聡;Kazunari DOMEN
  • 通讯作者:
    Kazunari DOMEN
「コンピュータネットワーク入門」〜TCP/IPプロトコル群とセキュリティ〜
《计算机网络概论》-TCP/IP协议与安全-
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神坂 紀久子;山口 実靖;小口 正人;松岡 聡;小口正人
  • 通讯作者:
    小口正人
枯草菌のRNA ポリメラーゼαサブユニット遺伝子rpoAの 上流域の解析
枯草芽孢杆菌RNA聚合酶α亚基基因rpoA上游区域分析
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松岡 聡;篠原 嵩人;朝井 計;戸澤 譲;朝井 計,林田莉奈,白川文教;美田知也,細村匡太郎,渡辺 智,兼崎 友,板谷光泰, 朝井 計, 吉川博文;渡辺 葵,山下園加,井上拓也,吉川博文,朝井 計;松岡 聡,篠原嵩人,朝井 計,戸澤 譲;徳山麻里,吉川博文,朝井 計,原田翔太,兼崎 友;大坂夏木,高田 啓,多喜乃雄太,兼崎 友,渡辺 智, 千葉櫻拓,吉川博文,朝井 計;徳山麻里,朝井計;横山奈央;朝井 計
  • 通讯作者:
    朝井 計

松岡 聡的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松岡 聡', 18)}}的其他基金

Molecular Mechanism of Glyceroglucolipids Involved in Cell Membrane Permeability of Gram-Positive Bacteria
甘油糖脂参与革兰氏阳性菌细胞膜通透性的分子机制
  • 批准号:
    22K05377
  • 财政年份:
    2022
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Accelerating High-Performance Computing Application Kernels Through Reconfigurable Hardware
通过可重构硬件加速高性能计算应用程序内核
  • 批准号:
    16F16764
  • 财政年份:
    2016
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高性能計算のためのプログラミングモデル
高性能计算的编程模型
  • 批准号:
    12F02044
  • 财政年份:
    2012
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
直接操作インターフェースのための高速制約解消系の実現
直接操作界面高速约束求解系统的实现
  • 批准号:
    05780227
  • 财政年份:
    1993
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
視覚的例による宣言的グラフィカルユーザインターフェースのプログラミング
使用可视化示例对声明性图形用户界面进行编程
  • 批准号:
    04780025
  • 财政年份:
    1992
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
グラフィカルユーザインターフェースにおける新しい抽象データの視覚化及び操作の手法
在图形用户界面中可视化和操作抽象数据的新方法
  • 批准号:
    03780021
  • 财政年份:
    1991
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ハイブリッド混合精度処理によるエクサスケール反復解法ライブラリの開発
使用混合混合精度处理开发百亿亿次迭代解决方案库
  • 批准号:
    22K12053
  • 财政年份:
    2022
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
大域的5次元第一原理モデルのエクサスケール乱流計算による水素同位体混合現象の解明
使用全局五维第一性原理模型进行百亿亿次湍流计算来阐明氢同位素混合现象
  • 批准号:
    22K03584
  • 财政年份:
    2022
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of stencil calculation and communication model to achieve high scalability on massively parallel computation
开发模板计算和通信模型,以实现大规模并行计算的高可扩展性
  • 批准号:
    18K11336
  • 财政年份:
    2018
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
High Performance Computing for Quantum Model Simulations on Exascale Computers
百亿亿级计算机上量子模型模拟的高性能计算
  • 批准号:
    18K11345
  • 财政年份:
    2018
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on transient response of impurity ion transport induced by electron heating
电子加热引起的杂质离子输运瞬态响应研究
  • 批准号:
    18K03591
  • 财政年份:
    2018
  • 资助金额:
    $ 8.32万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了