2010年1月18日月曜日

StreamGPU: SACSIS 2010 参考論文

CPU と GPU の協調動作
  • 尾形泰彦, 丸山直也, 遠藤敏夫, and 松岡聡. 性能モデルに基づくCPUおよびGPUを併用する効率的なFFTライブラリ. In 2008年ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集(HPCS2008), pp. 107-114, (Jan,2007), 2008(PDF)
  • Yasuhito Ogata, Toshio Endo, Naoya Maruyama, and Satoshi Matsuoka. An Efficient, Model-Based CPU-GPU Heterogeneous FFT Library. In the 17th International Heterogeneity in Computing Workshop (HCW'08), in conjunction with IPDPS 2008, Miami, FL, USA, Apr 2008, 2008.(PDF)
  • 額田彰 and 松岡聡. CUDA GPU向けの自動最適化FFTライブラリ. In 先進的計算基盤システムシンポジウム SACSIS2009 論文集, May 2009., 2009.
 上記2本の論文が StreamGPU に大いに関係する論文なので読んでみてください。FFT (高速フーリエ変換)、信号処理、画像認識など様々な場面で出てくる 計算処理だが、性能モデルにもとづき、CPU と GPU とで協調的に計算することで高速化を実現する論文。StreamGPU で今取り組んでいる SST の計算においては、CPU または他のノード (GPU なし)をより短いスパンでの異常検知、GPU をより長いスパンでの異常検知を実現する。我々の場合は性能モデルを作るほど複雑なスケジューリングは必要なく、かつ SPADEという言語で簡便かつ柔軟にプログラムを組めるところが強みですね。

マルチ GPU に関する研究
  • 渡辺祐也, 遠藤敏夫, and 松岡聡. 複数GPUにおけるセルフスケジューリングによる並列数値演算. In情報処理学会研究報告2008-HPC-111(SWoPP2008, Aug 5- Aug 7), 2008. (PDF)

    単一ノードにそれぞれが別々の性能を持つ GPU を複数持つ不均質な環境において (論文では4枚、GeForce 8800, 8800 GTX, 8800GT, 8600GTS) ,セルフスケジューリングというタスク分割手法を用いてアプリケーションを自動的に最適化する手法を提案。アプリケーションは計算がFFT などと比べてドミナントになり、通信がボトルネックとならない行列積を用いている。 StreamGPU において、複数次元をサポートするためにはマルチGPU が必須であり、このようなタスクスケジューリング機構も関係してくるだろう。



0 件のコメント:

コメントを投稿