空間冗長度の時間畳み込みによるクラスタシステムの高信頼化

通过空间冗余的时间卷积提高集群系统的可靠性

基本信息

  • 批准号:
    16650008
  • 负责人:
  • 金额:
    $ 2.24万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

本研究の目的は、汎用の高性能な計算ノードを多数高速ネットワークで接続するクラスタシステムの高信頼化であり、クラスタシステムの状態を最低限の空間冗長度で保持し、それを時間軸上で畳み込むことでさらに高い冗長度を確保する新しい手法として、skewed checkpointingという新しいチェックポイント方式を提案した。本年度はまず、前年度開発したチェックポイント方式のシミュレータを開発した。これにより、CPU/network/disk等の実システムの性能、および故障率に応じて、アルゴリズムの最適化を実施した場合の効果を検証することが可能となる。その後、提案するチェックポイント方式を実際のクラスタ上にプロトタイプ実装し、状態保存に要する時間、状態復元に要する時間を測定した。提案手法の有効性は、シミュレーションを用いて示すべきだが、そもそも故障は確率的に発生するものなので、結果の精度を上げるためには膨大なシミュレーションをする必要がある。特に、多重故障などの発生確率の低い障害に対する効果を示すことはシミュレーションでは難しい。そこで、マルコフモデルを用いて、性能と信頼性の両方を含むperformabilityの理論解析も実施した。シミュレーション評価から、CPU/network/disk等の実システムの性能、および故障率に応じて最適化する提案チェックポイント方式の有効性が明らかになり、また、この結果が理論解析結果とほぼ一致したことからその検証も行えた。この結果を踏まえ、実行中に故障率が変動する場合に動的にチェックポイント方式を最適化する手法に関しても提案し、シミュレーション評価により、その有効性を示すことができた。故障率が変動する場合の理論解析はまだ不十分であるが、実行中に故障率が変動するという、実環境に即した仮定を考慮することができたのは意義深い成果である。
本研究的目的是提高由大量通用、高性能计算节点通过高速网络连接而成的集群系统的可靠性。本研究的目的是维持集群系统的状态集群系统具有最小程度的空间冗余,并随着时间的推移保持集群系统的状态,我们提出了一种称为倾斜检查点的新方法,作为通过卷积确保更高冗余的新方法。今年,我们首先开发了去年开发的基于检查点的模拟器。这样就可以根据CPU/网络/磁盘等实际系统的性能和故障率来验证优化算法的效果。之后,我们在实际集群上实现了所提出的检查点方法的原型,并测量了保存状态所需的时间和恢复状态所需的时间。该方法的有效性应通过仿真来证明,但由于故障首先是随机发生的,因此有必要进行大量仿真以提高结果的准确性。特别是,很难通过模拟来证明发生概率低的故障(例如多次故障)的有效性。因此,我们使用马尔可夫模型对性能(包括性能和可靠性)进行了理论分析。仿真评估揭示了所提出的检查点方法的有效性,该方法根据CPU/网络/磁盘等实际系统的性能和故障率进行了优化,结果与理论分析结果基本一致。能够验证这一点。基于这些结果,我们还提出了一种在执行过程中故障率波动时动态优化检查点方法的方法,并能够通过仿真评估证明其有效性。虽然对故障率波动情况的理论分析仍然不够,但我们能够考虑执行过程中故障率波动的假设,与实际环境一致,这是一个重大成就。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
空間的・時間的な故障率の変動を考慮したチェックポインティング手法の初期検討
考虑故障率时空波动的检查点方法初步研究
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    東美和子;近藤正章;今井雅;中村宏;南谷崇
  • 通讯作者:
    南谷崇
多重故障を考慮した計算機クラスタ向けSkewed Checkpointingの検討
考虑多重故障的计算机集群倾斜检查点研究
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田島裕也;林田卓朗;近藤正章;今井雅;中村宏;南谷崇
  • 通讯作者:
    南谷崇
多重故障に適応したSkewed Checkpointingの提案
适应多种故障的倾斜检查点提案
Skewed Checkpointing for Tolerating Multi-Node Failures
用于容忍多节点故障的倾斜检查点
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    H.Nakamura;T.Hayashida;M.Kondo;Y.Tajima;M.Imai;T.Nanya
  • 通讯作者:
    T.Nanya
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中村 宏其他文献

不揮発性メモリを用いたニューロチップに関する検討
使用非易失性存储器的神经芯片的研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    富井 潤 ;近藤 正章 ;中村 宏
  • 通讯作者:
    中村 宏
キャッシュ電源遮断時の性能ペナルティ削減のための損失データプリフェッチ
丢失数据预取以减少缓存断电时的性能损失
トラクションコントロール実行:CMP向け実行制御方式の検討
牵引力控制执行:CMP执行控制方法研究
ソフトウェア制御オンチップメモリ向け自動最適化コンパイラの提案
针对软件控制片上存储器的自动优化编译器的建议
CMPにおけるリソース競合に着目した性能の解析とモデリング
侧重于 CMP 中资源争用的性能分析和建模

中村 宏的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('中村 宏', 18)}}的其他基金

トラフィックの時空間特徴量に着目したDoS耐性IoTアーキテクチャの研究
关注流量时空特征的抗DoS物联网架构研究
  • 批准号:
    23K28051
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
トラフィックの時空間特徴量に着目したDoS耐性IoTアーキテクチャの研究
关注流量时空特征的抗DoS物联网架构研究
  • 批准号:
    23H03361
  • 财政年份:
    2023
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Formulation of Teaching Methods and Development of Teaching Materials for Nursing Education in Online Education
在线教育中护理教育教学方法的制定及教材的开发
  • 批准号:
    21K10587
  • 财政年份:
    2021
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
故障率の変動を考慮した空間冗長度の時間畳み込みによるクラスタシステムの高信頼化
考虑故障率波动的空间冗余的时间卷积提高集群系统的可靠性
  • 批准号:
    18650010
  • 财政年份:
    2006
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
脊髄損傷時の不可逆的神経変性を治癒過程に導くアポトーシス抑制療法の解明
阐明抗凋亡疗法可引导脊髓损伤过程中不可逆的神经变性至愈合过程
  • 批准号:
    11770792
  • 财政年份:
    1999
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
悪性腫瘍増殖に及ぼす体外循環の影響に関する実験的研究
体外循环对恶性肿瘤生长影响的实验研究
  • 批准号:
    10770667
  • 财政年份:
    1998
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模科学技術計算を指向したプロセッサアーキテクチャの研究
大规模科学技术计算的处理器架构研究
  • 批准号:
    07780222
  • 财政年份:
    1995
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模科学技術計算に適したプロセッサの処理方式に関する研究
适合大规模科学技术计算的处理器处理方法研究
  • 批准号:
    06780228
  • 财政年份:
    1994
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
レイアウト情報を用いた高性能プロセッサの方式レベル設計支援システムの開発
使用布局信息开发高性能处理器的方法级设计支持系统
  • 批准号:
    05780224
  • 财政年份:
    1993
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
高性能コンピュータ設計を支援する方式レベル検証系の開発
开发方法级验证系统以支持高性能计算机设计
  • 批准号:
    04750302
  • 财政年份:
    1992
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

窒化アルミニウムウィスカーをホストとした高熱伝導・高信頼性蛍光体の開発
以氮化铝晶须为主体的高导热率、高可靠性荧光粉的开发
  • 批准号:
    23K23065
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
移動制御を伴う異種無線混合DTNを用いた災害応急対策時通信の高信頼・大容量化
使用具有移动控制功能的异构无线混合 DTN,在灾难响应期间实现高可靠和大容量通信
  • 批准号:
    23K24835
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
低消費エネルギ型銅-スズTLP接合部の経時変化構成モデリングによる高信頼化
通过低能量铜锡 TLP 结的时间相关配置建模提高可靠性
  • 批准号:
    24K07211
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
空間分割技術を軸とした多元接続型海中ワイヤレス給電通信の高信頼化技術に関する研究
以空分技术为核心的多连接水下无线输电通信高可靠性技术研究
  • 批准号:
    24K07486
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
超高密度反応性プラズマ法による窒化ホウ素ナノ結晶集合体構造の信頼性物理の研究
超高密度反应等离子体法氮化硼纳米晶聚集体结构可靠性物理研究
  • 批准号:
    23K26421
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了