2009年6月9日火曜日

GPU を用いた DSMS のスケールアウト処理

以下、研究テーマ。

研究概要

近年の DSMS 処理の研究では System S などを代表として、分散処理によるスケールアウト技術が注目されている。しかしながら、スケールアウトを実現する手法としては、現在の所、ノードレベルでしか考えられていない。本研究では、GPU の超並列コアによるスレッドレベルの並列化と Stream Processor による命令レベルの並列化を組み合わせることで、DSMS におけるスケールアウトを実現する手法を提案する。また、System S のプログラミングモデルである SPADE をそのまま踏襲し、そのコンパイラを拡張することによって、下位のハードウェアやスケールアウトの実現方法を隠蔽し、アプリケーション開発者から透過的に実現する。

本研究の評価として、YY 種類のXX 億個の株価データ(合成データ)を用い、ZZ 個のウィンドウサイズ(スライドサイズ 1)に対して移動平均、最大値、最小値を計算する。このウィンドウ処理は DSMS における典型的な処理であり、応用範囲は広く、 例えば、金融の分野における株価分析、通信会社の通話時間分析などが挙げられる。通常の CPU (1ノード、2~4 core、SSE 命令使用)、GPU 版 (1ノードのみ)、複数ノード (4ノード以上)を用いてそれぞれスループットを求め、GPU が明らかに最高性能が得られることを目指す。

本研究の Contribution は以下の通りである
- ストリーム処理と GPU 処理の組み合わせ
これはまだ未開拓の分野である。
- GPU 上で実現することによる性能最適化手法
CPU から GPU へのデータ転送時間と GPU 上の計算時間をオーバーラップさせることにより、通信のレイテンシを省く. また、その他の実装上の工夫について述べる。
---------------

この研究の続き
- アプリケーションの例としては移動平均であるが、国際論文として通すためにはもう一つアプリケーション例があると更に良い

0 件のコメント:

コメントを投稿