分散共有メモリクラスタを用いた疎行列線形代数演算ライブラリの効率的な実装技術

基于分布式共享内存集群的稀疏矩阵线性代数计算库的高效实现技术

基本信息

  • 批准号:
    16016225
  • 负责人:
  • 金额:
    $ 7.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

本研究では,コモディティハードウェアによる高性能な計算環境の実現を目的として,PCI Express技術を用いたクラスタ環境を構築し,比較対象として分散共有メモリ型並列計算機のSGI Altix 3700を用いてその性能を評価するとともに,コモディティ技術の可能性と実装上の問題について検討した.GbEネットワークおよびInfiniBandネットワークを使用した疎行列反復解法ライブラリでの評価の結果,同一の計算性能,レイテンシのネットワークにおいても,帯域幅が小さい場合にはスケーラビリティに限界があり,性能低下が見られることが分かった.このことは,疎行列線形計算においては(レイテンシよりも)帯域幅が性能を制約していることを示している.また,Altixとの比較結果から,PCI Express技術の活用によって既存の並列計算機を上回る計算性能が実際にコモディティハードウェア上で得られることを示した.さらに,平成17年度10月からは,より大規模な構成のOpteronサーバと複数のPCI Expressスロットを利用した広帯域なクラスタシステムを構築するとともに,筑波大学の協力を得て,MPIを通信レイヤに用いたソフトウェア分散共有メモリ環境向けOpenMPコンパイラOmni/SCASH MPIの移植・評価を行い,ソフトウェア分散共有メモリ技術の可能性と問題点について検討した.この結果,ノード間の通信帯域幅及びノード内のメモリ帯域幅の確保に重点を置いて計算環境を構築することにより,4-wayサーバを利用したクラスタ環境においても,スケーラブルな計算性能を実現できることを示した.ただし,疎行列処理においてはバリア同期等の前処理に必要なコストが他の計算に比べて大きいことから,ノード内での処理オーバヘッドを一層低減する必要があると考えられる.
在本研究中,为了利用商用硬件实现高性能计算环境,我们利用PCI Express技术构建了集群环境,并将其与分布式共享内存并行计算机SGI Altix进行了比较。 3700,并检查了商品技术和实现问题的可能性。使用GbE网络和InfiniBand网络的稀疏矩阵迭代解决方案库的评估结果表明,获得了相同的计算性能和延迟。还发现,当带宽较小时,可扩展性受到限制,并且性能会恶化。另外,从与Altix、PCI的比较结果来看。我们表明,通过利用 Express 技术,实际上可以在商用硬件上获得超过现有并行计算机的计算性能。此外,从 2005 年 10 月开始,我们一直在使用 Express 技术来实现更大配置的 Opteron 服务器和多个PCI服务器除了使用Express插槽构建宽带集群系统外,我们还与筑波大学合作开发了用于使用MPI作为通信层的软件分布式共享内存环境的OpenMP编译器Omni/SCASH。我们移植并评估了MPI,并研究了软件分布式共享内存技术的可能性和问题。因此,我们构建了一个强调确保节点之间的通信带宽和节点内的内存带宽的计算环境。通过这样做,您可以创建一个类。使用4路服务器。我们已经证明,即使在计算机环境中也可以实现可扩展的计算性能。但是,在稀疏矩阵处理中,屏障同步等预处理所需的成本比其他计算中更大,因此节点内的处理开销很高。认为有必要进一步减少这种情况。

项目成果

期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Performance Evaluation of Low Level Multithreaded BLAS Kernels on Intel Processor Based cc-NUMA Systems
  • DOI:
    10.1007/978-3-540-39707-6_45
  • 发表时间:
    2003-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Nishida;Y. Oyanagi
  • 通讯作者:
    A. Nishida;Y. Oyanagi
Improvement and evaluation of Smoothed Aggregation MG for anisotropic problems
针对各向异性问题的平滑聚合MG的改进和评估
Performance Evaluation of Parallel AMG Preconditioned Conjugate Gradient Methods for Large Scale Eigenproblems
针对大规模特征问题的并行 AMG 预条件共轭梯度法的性能评估
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A.Nishda;A.Nishda
  • 通讯作者:
    A.Nishda
Performance evaluation of a parallel iterative method library using OpenMP
Network-aware Data Mapping on Parallel Molecular Dynamics
并行分子动力学的网络感知数据映射
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

西田 晃其他文献

大規模固有値問題への前処理付共役勾配法の適用と評価
预条件共轭梯度法在大规模特征值问题中的应用与评估
AMG Preconditioned Conjugate Gradient Type Methods for Nonsymmetric Eigenproblems
非对称本征问题的 AMG 预条件共轭梯度型方法
広帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価
利用宽带网络的软件分布式共享内存的实现及性能评估
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    梶山民人;額田彰;須田礼仁;長谷川秀彦;西田晃;西田 晃
  • 通讯作者:
    西田 晃
非対称固有値問題への並列AMG前処理付共役勾配法の適用と評価
并行AMG预处理共轭梯度法在非对称特征值问题中的应用与评估
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中寿郎;平岡耕一;野村信福;豊田洋通;山下浩;八尋秀典;定岡芳彦;西田 晃
  • 通讯作者:
    西田 晃
大規模固有値問題への並列AMG前処理付共役勾配法の適用と評価
并行AMG预处理共轭梯度法在大规模特征值问题中的应用与评估

西田 晃的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('西田 晃', 18)}}的其他基金

分散メモリ型SPMDプログラミングモデルに基づく大規模線形計算の効率的な実装技術
基于分布式内存SPMD编程模型的大规模线性计算高效实现技术
  • 批准号:
    17680001
  • 财政年份:
    2005
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)
ハードウェア分散共有メモリを用いた並列線形数値演算ライブラリの効率的な実装技術
基于硬件分布式共享内存的并行线性数值计算库的高效实现技术
  • 批准号:
    14019030
  • 财政年份:
    2002
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
クリロフ部分空間法の分散共有メモリアーキテクチャ上への並列実装とその性能評価
分布式共享内存架构上Krylov子空间方法的并行实现及其性能评估
  • 批准号:
    13780200
  • 财政年份:
    2001
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
並列クリロフ部分空間アルゴリズムの共有メモリ対称型マルチプロセッサ上での性能評価
共享内存对称多处理器上并行Krylov子空间算法的性能评估
  • 批准号:
    11780194
  • 财政年份:
    1999
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

高性能・高信頼な高水準言語の実装向け持続型例外処理機構の理論と実践
实现高性能可靠高级语言的持久异常处理机制的理论与实践
  • 批准号:
    19H04087
  • 财政年份:
    2019
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study on Optical Computer Design through Photonics and Electronics Co-Optimization
光电子协同优化光计算机设计研究
  • 批准号:
    17K19975
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Highly parallel computing with many corallum mimic architecture
具有许多珊瑚模仿架构的高度并行计算
  • 批准号:
    17H01707
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Co-operation Between Approximate Networks and Parallel Algorithms(Fostering Joint International Research)
近似网络与并行算法之间的合作(促进国际联合研究)
  • 批准号:
    16KK0009
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)
High-level optimization of memory references for productive and efficient development of FPGA accelerators
存储器参考的高级优化,以实现 FPGA 加速器的高效开发
  • 批准号:
    17K12658
  • 财政年份:
    2017
  • 资助金额:
    $ 7.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了