CPU と GPU の協調動作
- 尾形泰彦, 丸山直也, 遠藤敏夫, and 松岡聡. 性能モデルに基づくCPUおよびGPUを併用する効率的なFFTライブラリ. In 2008年ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集(HPCS2008), pp. 107-114, (Jan,2007), 2008(PDF)
- Yasuhito Ogata, Toshio Endo, Naoya Maruyama, and Satoshi Matsuoka. An Efficient, Model-Based CPU-GPU Heterogeneous FFT Library. In the 17th International Heterogeneity in Computing Workshop (HCW'08), in conjunction with IPDPS 2008, Miami, FL, USA, Apr 2008, 2008.(PDF)
- 額田彰 and 松岡聡. CUDA GPU向けの自動最適化FFTライブラリ. In 先進的計算基盤システムシンポジウム SACSIS2009 論文集, May 2009., 2009.
マルチ GPU に関する研究
- 渡辺祐也, 遠藤敏夫, and 松岡聡. 複数GPUにおけるセルフスケジューリングによる並列数値演算. In情報処理学会研究報告2008-HPC-111(SWoPP2008, Aug 5- Aug 7), 2008. (PDF)
単一ノードにそれぞれが別々の性能を持つ GPU を複数持つ不均質な環境において (論文では4枚、GeForce 8800, 8800 GTX, 8800GT, 8600GTS) ,セルフスケジューリングというタスク分割手法を用いてアプリケーションを自動的に最適化する手法を提案。アプリケーションは計算がFFT などと比べてドミナントになり、通信がボトルネックとならない行列積を用いている。 StreamGPU において、複数次元をサポートするためにはマルチGPU が必須であり、このようなタスクスケジューリング機構も関係してくるだろう。
0 件のコメント:
コメントを投稿