鈴村グループ (旧・鈴村研究室) : [論文紹介] High-Availability Algorithms for Distributed Stream Processing, ICDE 2005

2010年6月23日水曜日

[論文紹介] High-Availability Algorithms for Distributed Stream Processing, ICDE 2005

High-Availability Algorithms for Distributed Stream Processing, Jeon-Hyon Hwang, Micheal Stonebraker, ICDE 2005

データストリーム処理システムの耐故障性 (Fault Tolerance)、高可用性 (High Availability) に関する論文。かの有名な Micheal Stonebraker 等のグループの研究。データベース周辺ではこのような FT / HA に関しては既に様々な研究、技術が存在するが、この論文ではじめて、データストリーム処理システムに関する適用が試みられている。

当然、アプリケーションが要求するノードダウン時のデータ損失の影響度合いによるのだが、一般的に、当論文では、３つのリカバリーモデルが存在すると述べている。Precise Recovery, Rollback Recovery, Gap Recovery. いずれも、プライマリーサーバー、バックアップサーバーの２つを仮定しており、プライマリが落ちたらバックアップサーバーに処理を委譲。プライマリとバックアップのステートを常に同期させることも考えられるが、ランタイムへのオーバーヘッドは多大なものになる。よって、このオーバーヘッドを少なくするために、以下の３つのモデルを列挙。

Precise Recovery: 一時的に処理の応答時間は増えるが、Failure を完全に排除し、結果にも影響を与えない。金融、証券系では必須
Rollback Recovery: 入力データのデータリカバリまでは保証するが、出力する計算結果が完全に一致するとは限らない。プライマリとバックサーバーノードの２つがあり、バックサーバーで再処理させた場合に結果が異なることを許す
Gap Recovery: 最もリカバリー保証がゆるい方式で、結果に影響を与えない古いデータは破棄し、ランタイムへのオーバーヘッドやリカバリーのスピードを高速化する方式

また、上記のモデルを実現するアプローチとしては以下の方式を提案

Amenesia: ランタイムへのオーバーヘッドを与えずに Gap Recovery を実現
Passive-Standby: プライマリはセカンダリ（バックアップ）に定期的にステートを送信
Active-Standby: セカンダリはすべてのタプルを並行して処理
Upstream backup: アプリケーション上の下流のノードが落ちた際には、上流のノードが、ログに一時的に保存しているタプルを再送信

4番目の Upstream Backup がユニークであろう。詳細は論文を。

鈴村グループ (旧・鈴村研究室)

2010年6月23日水曜日

[論文紹介] High-Availability Algorithms for Distributed Stream Processing, ICDE 2005

0 件のコメント:

コメントを投稿

メニュー

マイブログリスト

フォロワー

ブログアーカイブ

参加ユーザー

鈴村グループ (旧・鈴村研究室)

2010年6月23日水曜日

[論文紹介] High-Availability Algorithms for Distributed Stream Processing, ICDE 2005

0 件のコメント:

コメントを投稿

メニュー

マイブログ リスト

フォロワー

ブログ アーカイブ

参加ユーザー

マイブログリスト

ブログアーカイブ