分散共有メモリクラスタを用いた疎行列線形代数演算ライブラリの効率的な実装技術

基于分布式共享内存集群的稀疏矩阵线性代数计算库的高效实现技术

基本信息

  • 批准号:
    16016225
  • 负责人:
  • 金额:
    $ 7.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

本研究では,コモディティハードウェアによる高性能な計算環境の実現を目的として,PCI Express技術を用いたクラスタ環境を構築し,比較対象として分散共有メモリ型並列計算機のSGI Altix 3700を用いてその性能を評価するとともに,コモディティ技術の可能性と実装上の問題について検討した.GbEネットワークおよびInfiniBandネットワークを使用した疎行列反復解法ライブラリでの評価の結果,同一の計算性能,レイテンシのネットワークにおいても,帯域幅が小さい場合にはスケーラビリティに限界があり,性能低下が見られることが分かった.このことは,疎行列線形計算においては(レイテンシよりも)帯域幅が性能を制約していることを示している.また,Altixとの比較結果から,PCI Express技術の活用によって既存の並列計算機を上回る計算性能が実際にコモディティハードウェア上で得られることを示した.さらに,平成17年度10月からは,より大規模な構成のOpteronサーバと複数のPCI Expressスロットを利用した広帯域なクラスタシステムを構築するとともに,筑波大学の協力を得て,MPIを通信レイヤに用いたソフトウェア分散共有メモリ環境向けOpenMPコンパイラOmni/SCASH MPIの移植・評価を行い,ソフトウェア分散共有メモリ技術の可能性と問題点について検討した.この結果,ノード間の通信帯域幅及びノード内のメモリ帯域幅の確保に重点を置いて計算環境を構築することにより,4-wayサーバを利用したクラスタ環境においても,スケーラブルな計算性能を実現できることを示した.ただし,疎行列処理においてはバリア同期等の前処理に必要なコストが他の計算に比べて大きいことから,ノード内での処理オーバヘッドを一層低減する必要があると考えられる.
在这项研究中,我们使用PCI Express技术构建了一个集群环境,目的是使用商品硬件实现高性能计算环境,并使用SGI Altix 3700(比较分布式共享内存平行计算机)评估了其性能,并检查了商品技术的可能性和实施问题。通过使用GBE网络和Infiniband网络的稀疏矩阵迭代溶液库进行评估的结果,我们发现,即使在具有相同计算性能和延迟的网络中,可伸缩性也有限,并且在带宽很小时也可以看到性能降级。这表明带宽在稀疏基质线性计算(而不是延迟)中限制性能。此外,与Altix的比较表明PCI是与PCI的比较。它表明,Express技术的使用实际上可以提供超过商品硬件上现有的并行计算机的计算性能。此外,从2005年10月开始,将构建使用大型Opteron服务器和多个PCI Express插槽的宽带群集系统,并且随着Tsukuba大学的合作,使用MPI作为通信层进行软件分布的共享存储器环境的OMNI/SCASH。进行了MPI端口和评估,以检查软件分布的共享内存技术的可能性和问题。结果,通过构建计算环境,重点是确保节点内的节点和内存带宽之间的通信带宽,即使在使用4-diew Servers的群集环境中,也可以达到可扩展的计算性能。但是,由于稀疏基质处理中的屏障同步所需的成本大于其他计算的成本,因此人们认为需要在节点内的开销开销来进一步减少节点内的处理开销。

项目成果

期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Performance Evaluation of Low Level Multithreaded BLAS Kernels on Intel Processor Based cc-NUMA Systems
  • DOI:
    10.1007/978-3-540-39707-6_45
  • 发表时间:
    2003-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Nishida;Y. Oyanagi
  • 通讯作者:
    A. Nishida;Y. Oyanagi
Improvement and evaluation of Smoothed Aggregation MG for anisotropic problems
针对各向异性问题的平滑聚合MG的改进和评估
Performance Evaluation of Parallel AMG Preconditioned Conjugate Gradient Methods for Large Scale Eigenproblems
针对大规模特征问题的并行 AMG 预条件共轭梯度法的性能评估
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A.Nishda;A.Nishda
  • 通讯作者:
    A.Nishda
Performance evaluation of a parallel iterative method library using OpenMP
Network-aware Data Mapping on Parallel Molecular Dynamics
并行分子动力学的网络感知数据映射
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

西田 晃其他文献

大規模固有値問題への前処理付共役勾配法の適用と評価
预条件共轭梯度法在大规模特征值问题中的应用与评估
AMG Preconditioned Conjugate Gradient Type Methods for Nonsymmetric Eigenproblems
非对称本征问题的 AMG 预条件共轭梯度型方法
広帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価
利用宽带网络的软件分布式共享内存的实现及性能评估
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    梶山民人;額田彰;須田礼仁;長谷川秀彦;西田晃;西田 晃
  • 通讯作者:
    西田 晃
非対称固有値問題への並列AMG前処理付共役勾配法の適用と評価
并行AMG预处理共轭梯度法在非对称特征值问题中的应用与评估
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中寿郎;平岡耕一;野村信福;豊田洋通;山下浩;八尋秀典;定岡芳彦;西田 晃
  • 通讯作者:
    西田 晃
大規模固有値問題への並列AMG前処理付共役勾配法の適用と評価
并行AMG预处理共轭梯度法在大规模特征值问题中的应用与评估

西田 晃的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('西田 晃', 18)}}的其他基金

分散メモリ型SPMDプログラミングモデルに基づく大規模線形計算の効率的な実装技術
基于分布式内存SPMD编程模型的大规模线性计算高效实现技术
  • 批准号:
    17680001
  • 财政年份:
    2005
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)
ハードウェア分散共有メモリを用いた並列線形数値演算ライブラリの効率的な実装技術
基于硬件分布式共享内存的并行线性数值计算库的高效实现技术
  • 批准号:
    14019030
  • 财政年份:
    2002
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
クリロフ部分空間法の分散共有メモリアーキテクチャ上への並列実装とその性能評価
分布式共享内存架构上Krylov子空间方法的并行实现及其性能评估
  • 批准号:
    13780200
  • 财政年份:
    2001
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
並列クリロフ部分空間アルゴリズムの共有メモリ対称型マルチプロセッサ上での性能評価
共享内存对称多处理器上并行Krylov子空间算法的性能评估
  • 批准号:
    11780194
  • 财政年份:
    1999
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

高性能・高信頼な高水準言語の実装向け持続型例外処理機構の理論と実践
实现高性能可靠高级语言的持久异常处理机制的理论与实践
  • 批准号:
    19H04087
  • 财政年份:
    2019
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study on Optical Computer Design through Photonics and Electronics Co-Optimization
光电子协同优化光计算机设计研究
  • 批准号:
    17K19975
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Highly parallel computing with many corallum mimic architecture
具有许多珊瑚模仿架构的高度并行计算
  • 批准号:
    17H01707
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
High-level optimization of memory references for productive and efficient development of FPGA accelerators
存储器参考的高级优化,以实现 FPGA 加速器的高效开发
  • 批准号:
    17K12658
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Co-operation Between Approximate Networks and Parallel Algorithms(Fostering Joint International Research)
近似网络与并行算法之间的合作(促进国际联合研究)
  • 批准号:
    16KK0009
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了