2009年9月12日土曜日

HadoopDB

HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads http://db.cs.yale.edu/hadoopdb/hadoopdb.pdf

VLDB 2009 (8月開催)で発表された Yale 大学のグループの論文。以前のエントリにも書いたが、SIGMOD 2009 に書かれた先行研究を基にしている。

テクニカルな肝は 5.2.4 を見ればすぐにわかるが、SQL クエリを MapReduce のプログラムに自動変換し、並列に実行。Vertix や DBMS-X といった並列データベースと比較して優位性を示している。

この論文では、1章の Introduction が面白い. Facebook など商用の世界においても、ペタバイト級のデータ量になってきており、データ分析の高速化が益々重要になってきていることを述べている。


0 件のコメント:

コメントを投稿